In [1]:
%matplotlib inline
import os
import sys
#import pysam
import pandas as pd
#import pybedtools as pybed
import matplotlib as mpl
import matplotlib.pyplot as plt
from __future__ import division
import operator
import itertools
In [ ]:
pf_genome = read_fasta("/Users/philross/Dropbox/pfalciparum/PlasmoDB-11.0_Pfalciparum3D7_Genome.fasta")
In [ ]:
#>gi|9626372|ref|NC_001422.1| Enterobacteria phage phiX174 sensu lato, complete genome
phiX = """GAGTTTTATCGCTTCCATGACGCAGAAGTTAACACTTTCGGATATTTCTGATGAGTCGAAAAATTATCTT
GATAAAGCAGGAATTACTACTGCTTGTTTACGAATTAAATCGAAGTGGACTGCTGGCGGAAAATGAGAAA
ATTCGACCTATCCTTGCGCAGCTCGAGAAGCTCTTACTTTGCGACCTTTCGCCATCAACTAACGATTCTG
TCAAAAACTGACGCGTTGGATGAGGAGAAGTGGCTTAATATGCTTGGCACGTTCGTCAAGGACTGGTTTA
GATATGAGTCACATTTTGTTCATGGTAGAGATTCTCTTGTTGACATTTTAAAAGAGCGTGGATTACTATC
TGAGTCCGATGCTGTTCAACCACTAATAGGTAAGAAATCATGAGTCAAGTTACTGAACAATCCGTACGTT
TCCAGACCGCTTTGGCCTCTATTAAGCTCATTCAGGCTTCTGCCGTTTTGGATTTAACCGAAGATGATTT
CGATTTTCTGACGAGTAACAAAGTTTGGATTGCTACTGACCGCTCTCGTGCTCGTCGCTGCGTTGAGGCT
TGCGTTTATGGTACGCTGGACTTTGTGGGATACCCTCGCTTTCCTGCTCCTGTTGAGTTTATTGCTGCCG
TCATTGCTTATTATGTTCATCCCGTCAACATTCAAACGGCCTGTCTCATCATGGAAGGCGCTGAATTTAC
GGAAAACATTATTAATGGCGTCGAGCGTCCGGTTAAAGCCGCTGAATTGTTCGCGTTTACCTTGCGTGTA
CGCGCAGGAAACACTGACGTTCTTACTGACGCAGAAGAAAACGTGCGTCAAAAATTACGTGCGGAAGGAG
TGATGTAATGTCTAAAGGTAAAAAACGTTCTGGCGCTCGCCCTGGTCGTCCGCAGCCGTTGCGAGGTACT
AAAGGCAAGCGTAAAGGCGCTCGTCTTTGGTATGTAGGTGGTCAACAATTTTAATTGCAGGGGCTTCGGC
CCCTTACTTGAGGATAAATTATGTCTAATATTCAAACTGGCGCCGAGCGTATGCCGCATGACCTTTCCCA
TCTTGGCTTCCTTGCTGGTCAGATTGGTCGTCTTATTACCATTTCAACTACTCCGGTTATCGCTGGCGAC
TCCTTCGAGATGGACGCCGTTGGCGCTCTCCGTCTTTCTCCATTGCGTCGTGGCCTTGCTATTGACTCTA
CTGTAGACATTTTTACTTTTTATGTCCCTCATCGTCACGTTTATGGTGAACAGTGGATTAAGTTCATGAA
GGATGGTGTTAATGCCACTCCTCTCCCGACTGTTAACACTACTGGTTATATTGACCATGCCGCTTTTCTT
GGCACGATTAACCCTGATACCAATAAAATCCCTAAGCATTTGTTTCAGGGTTATTTGAATATCTATAACA
ACTATTTTAAAGCGCCGTGGATGCCTGACCGTACCGAGGCTAACCCTAATGAGCTTAATCAAGATGATGC
TCGTTATGGTTTCCGTTGCTGCCATCTCAAAAACATTTGGACTGCTCCGCTTCCTCCTGAGACTGAGCTT
TCTCGCCAAATGACGACTTCTACCACATCTATTGACATTATGGGTCTGCAAGCTGCTTATGCTAATTTGC
ATACTGACCAAGAACGTGATTACTTCATGCAGCGTTACCATGATGTTATTTCTTCATTTGGAGGTAAAAC
CTCTTATGACGCTGACAACCGTCCTTTACTTGTCATGCGCTCTAATCTCTGGGCATCTGGCTATGATGTT
GATGGAACTGACCAAACGTCGTTAGGCCAGTTTTCTGGTCGTGTTCAACAGACCTATAAACATTCTGTGC
CGCGTTTCTTTGTTCCTGAGCATGGCACTATGTTTACTCTTGCGCTTGTTCGTTTTCCGCCTACTGCGAC
TAAAGAGATTCAGTACCTTAACGCTAAAGGTGCTTTGACTTATACCGATATTGCTGGCGACCCTGTTTTG
TATGGCAACTTGCCGCCGCGTGAAATTTCTATGAAGGATGTTTTCCGTTCTGGTGATTCGTCTAAGAAGT
TTAAGATTGCTGAGGGTCAGTGGTATCGTTATGCGCCTTCGTATGTTTCTCCTGCTTATCACCTTCTTGA
AGGCTTCCCATTCATTCAGGAACCGCCTTCTGGTGATTTGCAAGAACGCGTACTTATTCGCCACCATGAT
TATGACCAGTGTTTCCAGTCCGTTCAGTTGTTGCAGTGGAATAGTCAGGTTAAATTTAATGTGACCGTTT
ATCGCAATCTGCCGACCACTCGCGATTCAATCATGACTTCGTGATAAAAGATTGAGTGTGAGGTTATAAC
GCCGAAGCGGTAAAAATTTTAATTTTTGCCGCTGAGGGGTTGACCAAGCGAAGCGCGGTAGGTTTTCTGC
TTAGGAGTTTAATCATGTTTCAGACTTTTATTTCTCGCCATAATTCAAACTTTTTTTCTGATAAGCTGGT
TCTCACTTCTGTTACTCCAGCTTCTTCGGCACCTGTTTTACAGACACCTAAAGCTACATCGTCAACGTTA
TATTTTGATAGTTTGACGGTTAATGCTGGTAATGGTGGTTTTCTTCATTGCATTCAGATGGATACATCTG
TCAACGCCGCTAATCAGGTTGTTTCTGTTGGTGCTGATATTGCTTTTGATGCCGACCCTAAATTTTTTGC
CTGTTTGGTTCGCTTTGAGTCTTCTTCGGTTCCGACTACCCTCCCGACTGCCTATGATGTTTATCCTTTG
AATGGTCGCCATGATGGTGGTTATTATACCGTCAAGGACTGTGTGACTATTGACGTCCTTCCCCGTACGC
CGGGCAATAACGTTTATGTTGGTTTCATGGTTTGGTCTAACTTTACCGCTACTAAATGCCGCGGATTGGT
TTCGCTGAATCAGGTTATTAAAGAGATTATTTGTCTCCAGCCACTTAAGTGAGGTGATTTATGTTTGGTG
CTATTGCTGGCGGTATTGCTTCTGCTCTTGCTGGTGGCGCCATGTCTAAATTGTTTGGAGGCGGTCAAAA
AGCCGCCTCCGGTGGCATTCAAGGTGATGTGCTTGCTACCGATAACAATACTGTAGGCATGGGTGATGCT
GGTATTAAATCTGCCATTCAAGGCTCTAATGTTCCTAACCCTGATGAGGCCGCCCCTAGTTTTGTTTCTG
GTGCTATGGCTAAAGCTGGTAAAGGACTTCTTGAAGGTACGTTGCAGGCTGGCACTTCTGCCGTTTCTGA
TAAGTTGCTTGATTTGGTTGGACTTGGTGGCAAGTCTGCCGCTGATAAAGGAAAGGATACTCGTGATTAT
CTTGCTGCTGCATTTCCTGAGCTTAATGCTTGGGAGCGTGCTGGTGCTGATGCTTCCTCTGCTGGTATGG
TTGACGCCGGATTTGAGAATCAAAAAGAGCTTACTAAAATGCAACTGGACAATCAGAAAGAGATTGCCGA
GATGCAAAATGAGACTCAAAAAGAGATTGCTGGCATTCAGTCGGCGACTTCACGCCAGAATACGAAAGAC
CAGGTATATGCACAAAATGAGATGCTTGCTTATCAACAGAAGGAGTCTACTGCTCGCGTTGCGTCTATTA
TGGAAAACACCAATCTTTCCAAGCAACAGCAGGTTTCCGAGATTATGCGCCAAATGCTTACTCAAGCTCA
AACGGCTGGTCAGTATTTTACCAATGACCAAATCAAAGAAATGACTCGCAAGGTTAGTGCTGAGGTTGAC
TTAGTTCATCAGCAAACGCAGAATCAGCGGTATGGCTCTTCTCATATTGGCGCTACTGCAAAGGATATTT
CTAATGTCGTCACTGATGCTGCTTCTGGTGTGGTTGATATTTTTCATGGTATTGATAAAGCTGTTGCCGA
TACTTGGAACAATTTCTGGAAAGACGGTAAAGCTGATGGTATTGGCTCTAATTTGTCTAGGAAATAACCG
TCAGGATTGACACCCTCCCAATTGTATGTTTTCATGCCTCCAAATCTTGGAGGCTTTTTTATGGTTCGTT
CTTATTACCCTTCTGAATGTCACGCTGATTATTTTGACTTTGAGCGTATCGAGGCTCTTAAACCTGCTAT
TGAGGCTTGTGGCATTTCTACTCTTTCTCAATCCCCAATGCTTGGCTTCCATAAGCAGATGGATAACCGC
ATCAAGCTCTTGGAAGAGATTCTGTCTTTTCGTATGCAGGGCGTTGAGTTCGATAATGGTGATATGTATG
TTGACGGCCATAAGGCTGCTTCTGACGTTCGTGATGAGTTTGTATCTGTTACTGAGAAGTTAATGGATGA
ATTGGCACAATGCTACAATGTGCTCCCCCAACTTGATATTAATAACACTATAGACCACCGCCCCGAAGGG
GACGAAAAATGGTTTTTAGAGAACGAGAAGACGGTTACGCAGTTTTGCCGCAAGCTGGCTGCTGAACGCC
CTCTTAAGGATATTCGCGATGAGTATAATTACCCCAAAAAGAAAGGTATTAAGGATGAGTGTTCAAGATT
GCTGGAGGCCTCCACTATGAAATCGCGTAGAGGCTTTGCTATTCAGCGTTTGATGAATGCAATGCGACAG
GCTCATGCTGATGGTTGGTTTATCGTTTTTGACACTCTCACGTTGGCTGACGACCGATTAGAGGCGTTTT
ATGATAATCCCAATGCTTTGCGTGACTATTTTCGTGATATTGGTCGTATGGTTCTTGCTGCCGAGGGTCG
CAAGGCTAATGATTCACACGCCGACTGCTATCAGTATTTTTGTGTGCCTGAGTATGGTACAGCTAATGGC
CGTCTTCATTTCCATGCGGTGCACTTTATGCGGACACTTCCTACAGGTAGCGTTGACCCTAATTTTGGTC
GTCGGGTACGCAATCGCCGCCAGTTAAATAGCTTGCAAAATACGTGGCCTTATGGTTACAGTATGCCCAT
CGCAGTTCGCTACACGCAGGACGCTTTTTCACGTTCTGGTTGGTTGTGGCCTGTTGATGCTAAAGGTGAG
CCGCTTAAAGCTACCAGTTATATGGCTGTTGGTTTCTATGTGGCTAAATACGTTAACAAAAAGTCAGATA
TGGACCTTGCTGCTAAAGGTCTAGGAGCTAAAGAATGGAACAACTCACTAAAAACCAAGCTGTCGCTACT
TCCCAAGAAGCTGTTCAGAATCAGAATGAGCCGCAACTTCGGGATGAAAATGCTCACAATGACAAATCTG
TCCACGGAGTGCTTAATCCAACTTACCAAGCTGGGTTACGACGCGACGCCGTTCAACCAGATATTGAAGC
AGAACGCAAAAAGAGAGATGAGATTGAGGCTGGGAAAAGTTACTGTAGCCGACGTTTTGGCGGCGCAACC
TGTGACGACAAATCTGCTCAAATTTATGCGCGCTTCGATAAAAATGATTGGCGTATCCAACCTGCA""".replace("\n", "")
In [77]:
def read_fasta(fasta_file):
seqs = dict()
with open(fasta_file) as f:
header = f.readline()
header = header.rstrip(os.linesep)
header = header.replace(">", "")
header = header.replace(" ", "")
id = header.split("|")[0]
sequences = []
for line in f:
line = line.rstrip("\n")
if(line[0] == ">"):
seqs[id] = "".join(sequences)
header = line
header = header.replace(">", "")
header = header.replace(" ", "")
id = header.split("|")[0]
sequences = []
else:
line = line.replace("\r", "")
sequences.append(line)
seqs[id] = "".join(sequences)
return(seqs)
In [154]:
def occurrences(string, sub):
""" Counts overlapping string occurrences """
count = start = 0
while True:
start = string.find(sub, start) + 1
if start > 0:
count += 1
else:
return count
In [79]:
def max_dict_by_value(dictionary):
""" Returns top dictionary key and value """
return max(dictionary.iteritems(), key=operator.itemgetter(1))
In [114]:
def min_dict_by_value(dictionary):
""" Returns top dictionary key and value """
return min(dictionary.iteritems(), key=operator.itemgetter(1))
In [123]:
def most_frequent_kmers(seq, kmer_len, n):
""" Returns 'n' most frequent kmers of length kmer_len
within a sequence of interest """
kmers = dict()
final = list()
for i in range(len(seq) - kmer_len + 1):
kmer = seq[i:i+kmer_len]
if kmer in kmers:
kmers[kmer] += 1
else:
kmers[kmer] = 1
for i in range(n):
maximum = max_dict_by_value(kmers)
final.append(maximum)
key = maximum[0]
kmers.pop(key, None)
return len(kmers), final
In [124]:
def least_frequent_kmers(seq, kmer_len, n):
""" Returns 'n' most frequent kmers of length kmer_len
within a sequence of interest """
kmers = dict()
final = list()
for i in range(len(seq) - kmer_len + 1):
kmer = seq[i:i+kmer_len]
if kmer in kmers:
kmers[kmer] += 1
else:
kmers[kmer] = 1
for i in range(n):
minimum = min_dict_by_value(kmers)
final.append(minimum)
key = minimum[0]
kmers.pop(key, None)
return len(kmers), final
In [101]:
def most_frequent_kmer(seq, kmer_len):
""" Returns most frequent kmer(s) of length kmer_len
within a sequence of interest"""
kmers = dict()
for i in range(len(seq) - kmer_len + 1):
kmer = seq[i:i+kmer_len]
if kmer in kmers:
kmers[kmer] += 1
else:
kmers[kmer] = 1
maximum = max(kmers.values())
keys = [x for x,y in kmers.items() if y == maximum]
return " ".join(keys)
In [133]:
string = "ACGTTGCATGTCGCATGATGCATGAGAGCT"
kmer_len = 6
## Expected output: CATG GCAT
In [130]:
#%%timeit
most_frequent_kmers(pf_genome["Pf3D7_10_v3"], kmer_len, 10)
Out[130]:
In [121]:
#%%timeit
most_frequent_kmer(pf_genome["Pf3D7_10_v3"], kmer_len)
Out[121]:
In [122]:
least_frequent_kmers(pf_genome["Pf3D7_10_v3"], kmer_len, 10)
Out[122]:
In [117]:
most_frequent_kmer("AAATTGCTTAGTGTCCGAATCGGCATAGTGTCCAAATTGCTGAATCGGCATAGTGTCCGAATCGGCATAGTGTCCTAGTGTCCTAGTGTCCGATTGCGCAATAGTGTCCGATTGCGCAAGATTGCGCAATCCAGTCTTAAATTGCTAAATTGCTTCCAGTCTTGATTGCGCAAGATTGCGCAAGATTGCGCAAGAATCGGCAGATTGCGCAAGAATCGGCAGAATCGGCAGATTGCGCAATCCAGTCTTTCCAGTCTTGATTGCGCAAAAATTGCTTCCAGTCTTTAGTGTCCGATTGCGCAAGAATCGGCAGATTGCGCAAGAATCGGCAGAATCGGCAGATTGCGCAATCCAGTCTTGAATCGGCAGAATCGGCAAAATTGCTGATTGCGCAATAGTGTCCTCCAGTCTTTAGTGTCCTAGTGTCCGAATCGGCAGATTGCGCAATAGTGTCCAAATTGCTGATTGCGCAAAAATTGCTGAATCGGCAGAATCGGCAGAATCGGCATCCAGTCTTAAATTGCTGAATCGGCATAGTGTCCGATTGCGCAAGAATCGGCAAAATTGCTAAATTGCTAAATTGCTAAATTGCTTCCAGTCTTGATTGCGCAAGATTGCGCAATAGTGTCCGATTGCGCAATAGTGTCCAAATTGCTTAGTGTCCGAATCGGCAGAATCGGCATCCAGTCTTTCCAGTCTTAAATTGCTGATTGCGCAATCCAGTCTTGATTGCGCAAAAATTGCTGATTGCGCAAGAATCGGCATCCAGTCTTGATTGCGCAAAAATTGCTTAGTGTCCGAATCGGCATAGTGTCCGAATCGGCAGAATCGGCAGATTGCGCAATAGTGTCCTCCAGTCTTTAGTGTCCGATTGCGCAATCCAGTCTTTAGTGTCCTAGTGTCCTCCAGTCTTTAGTGTCCGAATCGGCAGAATCGGCATAGTGTCCTCCAGTCTTGAATCGGCAAAATTGCTAAATTGCT", 12)
Out[117]:
In [132]:
import string
def __init__(self):
self.trans = string.maketrans('TAGCtagc', 'ATCGATCG')
def complementary_strand(self, strand):
return strand.translate(self.trans)
In [140]:
c = { "T": "A", "A": "T", "G": "C", "C": "G" }
def complementary_strand(strand):
for base in strand.upper():
yield TRANS[base]
In [152]:
def complementary_base(nucleotide):
c = { "T": "A", "A": "T", "G": "C", "C": "G" }
return c[nucleotide]
def complementary_strand(strand):
return "".join(map(complementary_base, strand))[::-1]
In [ ]:
complementary_strand('CGTTACATTTAATAAATGGAGATATTCGGCGAGTGGGCCCAGAGCTCGAAATCGGCCCCGTTATCAGGCCTTGCTATTCAAAGATTCTGTGCATGGCGAAGGGTTACACGTTTGATTTAGGAAGGGTGTGCTAGATTACGCGTTTTTGAGGTACGATGCCTTGCTCCGGATCGCCTCAGTCACCTTCGCACGCATGCGTGGCCCGGAATTAGCGAAGCAGGCAGCTTGCATGAGACTACACAACATCAGCTAGCAACAATAAATTTGAACTAAGCGCATATTCGCCGCGGGCCTAGGTCTAGGACAAATCCTTCGCGTGTCGTGCTGCCGCAAAGCCCTAGGAATTACCTGATGAAATCTCGACCTGTATACAACCTGACACCATTGGGATTATCTCTTAAGGCGGGATGGGGATGTCCGTCCTGGGTAACGTGCGGTGGACAAACTTTAAATGTATCTGCCTGTTTAAACTGGTCATAAGTCAGAAGGTACCTACGCACCGACGAGGATGCAGGCTACAAGGTAGCACCGACTCCTATTTTGCTAGGCGCAGCGACTTTCGTATCCTGATCCCGAGACTGCTAATCAGAGGTGGAGCTTTACTCGGGCCCACACTGTCTTACGTTTCTCTATCCTTGTACGAAGGCATAGTCCGACATGCAACCAATAGAGCTCCTGTCCTAGCAAAAATGATACCGCGCATAATGTGTCTGGTTGATCGACCCAATGCAATAGGCAGGGTCGGCACTGAAGCGTGGAGGATCTTGGCTTACTAACGAGTTTGGAGTCTGGCCATTGGGTCTTTCGGGACTGGAATTCTCCAGGAGGTGTAAATCGGTTGCGCGGTTGGAAAGGGTCTGCCATATTGCCCAAACTAGCACGCGACTACTCCGTTCAAACAACTAAGCGAAGTAAAGCGTCAGACACAACGAATACAACGATTATATAAGACGTTATTTTGGGGAGCGTCGTTTTTGTGGGAAAAATTGCTTCGACATCTTATTATTGTATTGGCCTCGTGCGGCCCAGAGCCTCGAGAACGTGTCAGTGCATGCTCAGTGCTAATGAGAGAAATCCTCATCGGTCGCGGGTCGGTTCCGAGTACATCTGAAGTTCGGAGGCTAGAGCGGGTCTGGGGCTGCGATTCCCCAGCTCAGCCTCAATGCATTCGCGACAGCTCCATGCGATCGTCGACGCCCACTGATCAAGGTACCCCCGGGGTGAATGCGCCTGCTTGGCCTGTTAACACCATACAAACGGGCGTATCGTGACATATATGGGCCCGTAAGCGTAGTCTGTAACGCTACGACCCGGTGGCAGCCCTCTTGTTTGCCACCAGATCTGGGGTCTGAGAGAAGCTTCCCTCCCCTGGCCGGCCTATGTATAGCTACAGGAGTGTCGAGGTGTCGTGACCGGTCCGATGAACAAGAGTCCATTGTGGGTTTGAATAGCACGAAGGGGCAGCATTGCAGAAACGTAGACTTTAGGACGGCTGATATTGTAGAGTAGAAACAAGGGGCCATGATGCGACCCCGATGAAGGAAATTTAGTGTTAGTTGTTCCCCCGAGATACTCCGCGGTTCAATCAAAACTTTATGACCTATTTCTTGTCTGGGTCCTGAGTAACTCAAATATCAGACACCACATTGTATGGCTTCTCCGGTGGGTGGGTTCGCGCAATGGATCATTGCTCCTGCGGATATCGATCGCAAAACCGGAAGCTGTGGGACAATTTGGTGCCTTCCAAGCCTAGAGCGGATCACTTCCAGGCTCAATCTCAGGTTCCGTTTACTGACAGTGGGAGTGCCGCCGCTTCGCTTCGTTATAATTAGAGGGGGAACGCCCCACAAACCTAGTAGCCTGTACAGTTGTGTGGGTGCCTAAGTTATTCCTCACCATGAAATTGAATCAATACGCAGTCATGACAATACCTCACACTTAAAATACGTATGTTACCGGCTAAGGGAGCACGGCACTTTGTCCAGATTGGCGCGTCACATATCTGTTTCCGCGATTGTTCGGTGTATAGGAACCGGCGTGATATCCTTTGACCGACAAGCGCACTGTCTTCGCCTCATTATGTTAATTAGGAAGGGTGGGTATTGGGTCGCTGCGGGGTCAACGAGAAGCTTTCTTAGGCCCGCCTCCCGAATAGCTCTCAACATAATTGTACGATAGAATACGTTGGCTTACTGAGAATGTAGACGTGAGGTGGGATTCCGTATAGTGTGATAGTTAATAATCACAAGCGTATCGGCTTGCCCTAAAAAAACTTGCGGCGAGGCTTCATAGAAGTGGAAAATGTGACAGACGCCATTCCATGAGGAGATCATTCATTCGCATTAGCTTACATTGCAGAGCTAGTTGGTTACCTTGGAATGTTCGCGGCTCGCAATGCGCGCCCCTCCGAGCATCTAACGCTCACTCACAATGCGCTGAATCGAGTGTACGGTTGGCACGGGAAGTAGGAGCGTGTCATCCATGGAGAGCTATCAGTTATCACTGGCTGTGACTCTAACCTGCCAAGACAGCCCAATATACCTAATACAGACTTCACACTTAGGCCGCTAGGGGTAGAAAACCATATTAGGAGCCTTTCCCTATCTAACACGTGCGCGCATAGGGATTCCTACGGGTCTGATGACAACTTGAAACAGGGCTAATGAATAAATACTTCCGGATAGACATCTTAAATGCTCTGCCAGTCATACACCATCATACCGATGAACCTAGGGCCCGGGTCACATCTTTAGGAGGACGACTACCTCGACCCTAGCGTATCGCTTGTAGCGGCCACGCGGTCCACCTGCGGCGGACCGGTGGGGAATATTTGTTTATGTCGCCAACTGTACATAACACGGTCAGTTTAAAGATGCTAGTTGACACTGCGAAAACCATGTGGGCCGTTATAAAAACGCCGATATTAATAGCATTAAATAAACTTGAGTGAAAAAGCAGGTTTGAAGTTGTCTGATCGTTTATTTCACATGTAGATATATATTCGGAGGCCCAGTCCGTACAGATTGGAGGGGGGGATAGAAGTGTATTCGCAATATTACATGCGTAAAACAACTGATAGGTTATGAGCCTTCGCTTACTGTTGCGCCACGGCCCATAAGTGCCTACAACATCCGTCCTCAGGTCGCACATACGACTGATATCATCTAGTCAATCGCCGCGGGGGGGCTCAGTTTGGTTGAATTGAAGCTCATTAAACGAGAGATTGGCCGCCGTGATGGGCGAAAGAAGCCCGTATGTGGCACGTGGATACCCACCCTATGCGGGGTGAGCCGTGCGAGGAAGTCCTGACCGGCGGCAGAAGACCCCCAGAGGCGCTTAGACATCGAATTGGTAGTATTCCCGAGGACTCGAGTGGTACCCCCGAGCACGGTTTGAGCGGCCACCCAGTAGGACACTTACAAAGAGGCCGCCCGGACGCTCGTGCTTGCCTGGCTGTGTTTTTAGCGGCAATTCGTCTCCGTTCCAAGAAGGGCCAAAGGTAAAACCGAGTTTCTCGGGTCTATATTGCTAAGGCTTTCCGGTCACGGGAAGGGCCAAGGTCTGTCGGCATTGTACAACTTCTATCCACAATTGAGTACTTCAACTAGAAACCCGTACTAAAGTTGCGATGTTAGGAACGAGCTCTTCTCTCCCCGGCAGGCGATCCAGCGCTTCGTCTATGGGGCCAGCCACTTGATAGGCGCAGATCACTAAAAAATTCCCTCTCATGCCATTTACCGAACCAAGCTTTAATCCTCTTCCTTCCCGGGGTACGTGTTGAGCATAGTCTAACCACCTCCGGGGATTAGCTATTGGACGAATCAAAGTTAGATGATTGCTCACTTGGCCGCAAATAGGAAGGTTTAAGTCTATATGGCATGTTCACGGAAGGCAAATGGCCGTAACTCCATACGGCGAAGAATTTGGAACGTTTCGCTCTTTCCGGTCAATATATAAAAGGCTTCCTCCCCCCATTGGGGGGCCATATACATGAAGGACAAGCCAGGCGCCTCGCACAACCCTATACGCATGATGGTTCATCACCCTTTGCTGAGCCCGTCAACATGGGCCCCTCCGATGCGCTGAGAGCTTTGCGTTATATGGCCATTAGTCGGCGTCTAGCGCCGTAGTGGATCTCACGGCCATATACCTGAGGACAGATGAGTAAAAATGAGGGTGAGTCATGGTTTATCAACATCAGAAGAACAACCGGCCTGCGCAGCATTATCTAGCGAGTGGGGAGACGCAAGAATATAATATGCGTTGACGCCCAGGCCAATGAAAAATCCTCGGTGGGGTAAGTGTGAGATTGATGCTTGCTAAGCCTATTTTCTGTATCTTGCCGCTCTAGGGGGGTCATCGGCTCATCGACTCATTTAGAAGGCTCGAGTTCTCAATATACTGAGCACCTTGTCATCCTACCTTGTAGCTCCTCCTGATGGAGGCCAATGCGGTGAGTTCTGCGACCTGCACATCAAGAAACGTTGGTAATGGGCTGTCCGGACGACTGTACGGCGACCCTACCATACGGCAGGGTTCACAGGGAACTGCGATTTGATCTTCGCAAGGACACGAACAGGTAGAGTTAAATTTCGGTGCTTCGACGACCGAGGATGTCCACTTCGGTCTAAGGTTATACACTGAGGAAGCCTTCGGCCGGTGTCTAACATACGTTTCCTGATAAATGGCGGACCGGCCGCACACGCATGTAAACTCGAAATAAGCGCATTGAGTAGGGTATATCCACTCGAGTATATGTGTTAATGCCCTCAGGGTCGCAAGCTGCCCCTAGGGCGGTAAAACATTTCTCTCCTGTTTCAGACAATTCTTGATCGCGTTGGTATCAAACGGTCGACAATACACTCGCCGCCTAGGCCGATGACTAGGTAGCTCCATGATGTGACTGTGTTTGTATAGAATTTCAGGCCGTTCCGTGCGTCGGCTATAGGAAGGGTATACAGCATAACCAATACCCTTACTTACTCGTGTTCCATATTCCCCGATGGGACGTAGACTCATTAATGTGAAAGATCGATACGGTATAGTAGGGCCTATACGGGGACTAACCCCAGCATGGCACGAGCTAGCGTCCCTTTGGGAGGTCGCACTGTGAAGGATATACGTAGAATGACCTAGTGAATGTCCCAGGAATCGTTAGTAACAGATGGGTAACATGTACTGAACCCAAGACCGGGCCTACCAGTAGAGGTTCCTGGCCAATATCTCTAGGATTAGAGATGACCACTTGGATTGCCTGACCCTCCCACAATTCCTTGACTACCGGGCGACCTTCTGCTCAGACTGGTCCAGGACAAGCTAAAGACTCTTACTATCATCCCGGGGTTCGTTTTCCTACATTACAGCAACACCGTTATGGCGTTCGAATAGTTCGGATTGCACACTTACAGGTGAGAATACGGCGTGGAGTGCTCCGGCAAAACTTATAGTGGGTACGATCGAATACCCGCTATCTCCCGACAAATGAAACTCTAACCCCCATCATTGCTAGCTGTAGCTTGTGCCGGGATGTGGCCTATAGGGTGTACTTCGGAGAGGGTATAGGACAGCCAGATTTACACCGTAGGATATACTTGGCGGGGCACGAGGTTTTGGTGATACCCGCAAAGGCAGGGCATGATGCACCTGACCAACTGTTCGCCCCACCCAACCAAAATGCTTGTTCTGGTCCTACTAGAAATGCGGGATGATACGCCGACAAGCCCGTGACCTCCCCCTGCATAATTCCTGCTACGTGTTTTGCTTCGACGGGTGCTCTACTGAGGAATTCTGCCGGTGATACGAGCCTTCCGAAACTCGGGTAGAAGCATAACCTCGGGGGTTGTGATAAATGCCAAGAGCGTACGACATCTGCGGAACGAGGACTAGGCAACATCGCGAAAGGGTCAAGCGTGCGATACATTCCTTCTGTGTGGTGAGCCACTATCGCTACCGAATCGAACCGACTCTTCCCCTGCAGCCGGACCGCAACCAACTTTTAGCCATGATAAAGATGTGGTCTTTATTGGTTCATACAACGAATCATAGGCGCAAGACAGGCTAGCCTATAGTACCCCAAATAACCAGCGAATGATATGGGCACCCCTAACCCACGTCAGATGCCGTATGTACACACGATCGGCATTGGGTGATAACGTCCCGTCATTTGGCGATCATGCAGATAAGCCTCATGCACTACGCAAACTTACGCATGTCGAGTAGTTGTTCGGATACCCCTATAGGTACGTCTTGATCGACTTCGGAGTTATATTTTGGTAACTTGGCGCTCCCGTATAGGGGTTATGCGAAATTTTTCATACCCGCGCATTTATGCGCAGGGCCATTGAGCAATCGCACGTCTTCCTGTGGGTGTTGTTGGCGTCTTAAGAACTCACTTAGACCCAGCCGCTTATCCTCTCCACTAGGGTACACTCCTCACGACTACTGGACTTGAGTTCCACTAAGCGATGCCATGCGCGATAGACGAGAAGGTCTAACAAAGTGAAAAACAGTACGGAAGTGATCCTTAATTTTTCCAGAGGATCCTCATATACCCCACACCCGTATTACTTTTTCCATCCTCTCGCTGTACCCAAATCTTGCAAAGACTAATGTACTTAGAGATTGGTTTCTGCGTGAGCAGTTCACCCATGTTTAAGACATGTCTGGGTGAAGCCCAATGCATCAATTCACGGAGAGAGTCGGGACTGGTTCAATGATCTATCTCTACCAAGGTGATGGACTTGATGTTTACAGCCTATACCATAAGAGTCACTCTTTCTGCTAAGTCACCAACGCCCTAATTTTATTATCAATAGCCTAAACCTGGAATCAGTCGCCTACCTAACTCAGACGTTGGGACCATGTAACCTTGATAGGGTCCCCGAGAGCATATCAATGGCCCCTCCTGGTACGCTCTAACCGGGATCTGTTGTGCGTAGACCTCAGAATGTACAGAATTTAATCTTAGCCCCAGGGCTTAAGCACTTAAACTCTCGTCGTGTGGTCCCATTTAGAGCGAGTTTTCCACTTCGGATAACGCGTCTAGAAGCTAATGGGTGTACGGAGATGAGTCGAGGGATACACCCTAAGTATTGCTCAGGGACAGTCGAGAGGACAGTGTGTGAGAGCCGACCTCATAGGTATAGATCAATCCCCCTGCTAACCCGCCCACCGTGGTTCTGACGTTCCTCGCTCTCGGCAAAAGATATCCAGGTGGTGTGGGGATTTCGCCCGTAAAGAAGTGACCGAAACAGAGTGCCTGCCCATGTTAGGAGATTTCGACCTGTAGACGATCGAATTGGACTAGAACTAGTGTTGTGGAAGAGGGGGCGTCAAATTACCTACAACGTCTTGGGCGAAGACCCGTTAGTGGAAATAGGCGCGGGAAATTATGGGGGCCTCCCCTTTGGATCGCCATGCTCCTTTACAGAAGCCCCTACAATTCCTTCCAACCTGTTTGCTTTGCGCGTTTAGGGGAACCCGGCGCACGGAACGGGCGTGTTCCGGGTAGCTTTCTGAGAATAATAAGAGAAGAGGCCAGAACATCGGCCTAAGCTGAGGGCAATCGTGCCAATAGGGGCATGTAAGAGAGCAATCCTTACCCCTCTAGTACGAAGGTAGTAACAAAGGACTGGCCCGATGAAGCAGACTTTATTGTCGCATACGTTCGTAATGCACAAGGCGCCGCGAACCTTGCAGTATGTCTGGTAACAATCTACTTCAAGTTCTCTGAGCCTGACTACCTCCCCTTACCCCAGGAGGATGTCCCACATTACCGCCCGGGGTTGATCCGAAGGTCCTTTTGCGTGAACAGTTGAGTTAAGCTATTGATTGTCCTAGCCGTAGTTGCGAGAGGCGTCTCGGTAGGTATACTGGCGCCCCCGCTAGTGGGGTCATTATTGATTTGAGCACACTTAGCTTTGGCTGCGCGTAACTCTTCGCAAAGTCCTGTAGTTCTTTAGCGCCGTGTTCCTTGTTCAAGGGAGGGAGTACCTGTACAGGGACGTAAGAGAGGGTGCCGCCAAGCCTACCCACCTTATTTGGAGTCACTTGCATAATTAAGGGTGCTGGATTCTGGTAGGGACCGGTTCTGTCCTCGCCTTAGAAACAACTAGCTTACATCTATAGAGTTACGAGTGAACACGGTATGCCTCAAATTGTCTCTGGTACAGCAATTTGTTATCATTGATCTAGACTGGCCTCTAAAGTTCGCTTCGAAAGCCGTTAGACTGCCTTCAGGTGGAACTTTTGAGCCCCCCTGTGAAAGGGTAAAGAAACCACCTATGCTTACCAGTGGTTTATCTGCTGCCCCAGCTGTGCCCTCCGAAACAATGCGTCTAATTCCGGTTCGCGATCGTTGATCGTGTCGTAATTGCTCATTTTAGCCTTAAATAGCATTTCGATGAATTGCGTCACTGCTTCAAGCATGCAGGGAGGGTGGGGTAGGCAAGAAACGGCCAGTCTAGGTAAAGATATCTATGGTCCAGAGGGGTGTACCCTCGCCTCACGGACTTTACCATTTTGTATAGCATCATGGCCGTGTTCAGTCTTCGGGCCCTCCGATGTCTGGAATTTCCTTCAGCTGGCAATCGCTTCGTCTCTCGCAGAATAGCCCATCCTGGTGCAACAATGACCACCTCATTTATAACACAGCCTTGTACAACGCTTCAACTAATTATGGGTCCAAAGTGTATGTGTCAGGGGCATTAAACCGACTGCCTGCCTTTGTTCTCACGATACGGTATACCGTCTAACAGCCGCTCAGACGCCTATGAGTGAGAAACGAAATGAGCATAGTGGTAGTGCCTAACAATCATGCGGATTAGGCTTCTCCCTGTCCCCTATTGGGTCAGACTACGGTATGCGCTTGCGTCACAAAATTCTGAGGGCGCATAGATTCATGGGCGCATCCGTTGCGGCCAGCTACCCGGCAGTTACCGCAGGAGTCCCCCTGGATTCGCACGAGGTAAAGTAAAAACTACCCATTGCGCTCAAAAATCTTCCTCACTGAAGCCAGTAATTTATTTTCTATAATTCTGTGTTCGCACCGCTCCGAACCGGTTCCATTCACCGATATGATCCTTGGGGACTTCCGGCTAGGTTTCGGAATCATGCTATTAGGATGAGGCGCACTGTCACATACTCAGCAGTCTCGAGTAGGCTTCTTGGTGATGGGGTCTGCTTTTTTCAAATAGGACTACGTTCCGTTGCACACATAATATTGTCCACCTGCTGAGAAGCCACTAGGTATGACGGCTGCTGGTAATAAGCACACCTCACTCCACAGATCCCTTATAGGAGAGTGAATAACGTGAGCGACTCGGAAGTTGCGATAGGTGATTAGGCCCCCTGATCATAAGGTCGGTGCTGCGTCAACTAGTACTGTTAACGGATTAGAATAGCCCGAAGATACTGGATTGGGAGTTGCCAATGGTACAACGGCAAGGCTCATATGCCGAGACTGTCCCGCCAC')
In [173]:
def occurrences(string, sub):
""" Counts overlapping string occurrences """
count = start = 0
positions = list()
while True:
start = string.find(sub, start) + 1
if start > 0:
count += 1
positions.append(str(start - 1))
else:
return count, " ".join(positions)
In [ ]:
occurrences("TGTAACAGGTTATGAGTCGATGGTAACAGGTAACAGGTGAAGGAACAGGTAACAGGTTATGAACAGGTCCATCCGGGGAACAGGTAACAGGTACAACCAACTAACAGGTCTGGAACAGGTTTAAACAGGTTAACAGGTAAACAGGTACAACAGGTAACAGGTAAACGCTCCACAACAGGTTACTCGTAACAGGTAACAGGTTATATCAACAGGTCTATATTTAGTACAAACAGGTGCAACAGGTCTCAAACAGGTAAACAGGTTATTGCAACAGGTTAGAACAGGTAACAGGTTTAACAGGTAAACAGGTTCGCTCGAAACAGGTGAAACAGGTCAACAGGTGGAACAGGTTAACAGGTCAAATAACAGGTACAAACAGGTACAACAGGTGGGGCACAACAGGTAAACAGGTGAACAGGTAACAGGTAGAACAGGTATAACAGGTCAACAGGTAACAGGTAACAGGTAAAACAGGTATGCCTACAACAGGTAACAGGTAACAGGTCCAAGCAACAGGTGATAACAGGTTTATTAACAGGTAACAGGTGAACAGGTTAACAGGTAGAACAGGTACTTGAAGGTAAACAGGTAACAGGTGAACAGGTTCGGGGCAACAGGTAACAGGTAAACAGGTTTGAACAACAGGTAAACAGGTAACAGGTGACAACAGGTCAACAGGTAACCAACAGGTGAACAGGTGCGAACAGGTTAAACAGGTAACAGGTAACGTTGCACTTGGCCCAGCGAACAGGTCAACAGGTATTCAAACAGGTAACAGGTGGTAACAGGTAACAGGTAACAGGTCTATCTAACAGGTGATCGAACAGGTTAAACAGGTTAACAGGTCAACAGGTAACAGGTCAACAGGTTCTCTAAACAGGTAGCTGTTAAGTGAACAGGTGTCAACAGGTCTGTAACAGGTCGAATGAACAGGTAACAGGTATATAACAGGTAACAGGTAACAGGTGAACAGGTCAACAGGTTAACAGGTAACAGGTGGTCAAACAGGTCAAGAGGAAACAGGTTATCTTAACAGGTTTTGAACAGGTAACAGGTAACAGGTAACAGGTCGTAACAGGTTTAGTCAACAGGTCGTTCAACAGGTCAACAGGTTGCAACAGGTAACAGGTCCATCTAACAGGTAACAGGTATTCATTGTAAACAGGTAAGAAACAGGTGCCCGAACAGGTGGGGTGGAAGCAACAGGTAACAGGTATGAACAGGTCAACAGGTAACAGGTCTACAACAGGTCAACATAACAGGTTCGGTGGAAGTAACAGGTAACAGGTGTTTCAGTGACAACAGGTTGTACCAAACAGGTAACAGGTAACAGGTAGCAAACAGGTCCTAGTATCTCGACGCGAAACAACAGGTCAACAGGTCCAACAGGTACAAACAGGTGAACAGGTACTCGAAGAAACAGGTGGCAAAAACAGGTTAGAACAGGTGAGAAACAGGTATAACAGGTCAACAGGTTTGTCGAACAGGTCTAACAGGTGAGGAACAGGTAACAGGTAACAGGTTGAAACAGGTAACAACAGGTATAAACAGGTGGAAACAGGTGGACAACAGGTGCGATAACAGGTTCAACAGGTAACAGGTTTAAACAGGTAAACAGGTGATAATCCCAAACAGGTAACAGGTATAACAGGTTCTACAACAGGTGCAGAACAGGTGGGGTCGATGTGAACAGGTTCGCAAACAGGTTAAACAGGTAGATTAACAGGTAAACAGGTAACAGGTTAGAAACAGGTTAAACAGGTCAACAGGTCGAAACAGGTTAACAGGTCGTGAACAGGTCAACAGGTCTAACAGGTGATTGTCGGGAAGTTAACAGGTTAACAGGTAACAGGTAACAGGTTGCTTATTCGTGCTAACAGAAACAGGTCAGGCAAAAAAAACAGGTAGTTATAACAGGTAGATCTCCACCAACAGGTTAACAGGTAAACAGGTTATTCAACAGGTAACAGGTGCGTAACAGGTAAATGCAACAGGTTGTGAAACAGGTACTGAACAGGTAGCGAGCGCGAACAGGTGCAACAGGTAACAGGTAACAGGTTGCAACAGGTTATAACAGGTAGTAACAGGTAACAGGTTTCGTGTACAAACAGGTCGAACAGGTTAACAGGTGCAACAGGTAACAGGTTGAACCAACAGGTAGAACAGGTCTGAACAGGTCCAACAGGTGCAACAGGTCTGCAATCGATTGGTAACAGGTCGCAAACAGGTCGGCAAACAGGTAATTAAACAGGTTAACAGGTAACAGGTTAACAGGTAACAGGTGAAACAGGTAACAGGTATAGAAATCAACAGGTAACAGGTGAAACAGGTAACAGGTCGACGAACAGGTAACAGGTACTTAACAGGTGAACAGGTTTAACAGGTGACACTAACAGGTAACAGGTCAACAGGTAACAGGTAATTAACAGGTAACAACAGGTGAGGAACAGGTGGCCGAACAGGTAACAGGTAACAGGTGAGTGCCGGTAACAGGTCCGGTAACAGGTACATCACTTCCAACAGGTTAAACAGGTAACAGGTAACAGGTTCAACAGGTAACAGGTAACAGGTACAAACAGGTTGAACAGGTCAACAGGTGAGAACAGGTAACAGGTACAGTCTAACAGGTATTTGTTGAACAGGTACACAACAGGTAACAGGTCCATTAACAGGTTTAAACAGGTAACAGGTCTAACAGGTGAACAGGTAAACAGGTAACAGGTCTGAACAGGTAACAGGTCGTCGAACAGGTGAACAGGTAACAGGTCAGTAACAGGTAAACAGGTCCAAACAGGTCCGCACAACAGGTCGAACAGGTAACCCTGAGAACAGGTAACAGGTGAACAGGTTAATACGAAGAACAGGTACTAACTAACAGGTAACAGGTTCTCAACAGGTATAACCAACAGGTAACAGGTAACAGGTAACAGGTGAGTTAACAGGTCTCTAACAGGTACAAACAGGTAACAGGTGAAAACAGGTAACAGGTGCCAGTAAATAACAGGTCAACAGGTCATCCCAACAGGTCAACAGGTTTCGGGGCTGAAACAGGTCAACAGGTCCAACAGGTGACGAACAGGTAACAGGTACGCTCAACAGGTGACAACAGGTCAACAGGTAACAGGTAACGTAGAACAGGTCACCAACAGGTTATCCGAACAGGTTAAACAGGTCAACAGGTTAACAGGTAACAGGTAACAGGTAACAGGTCAAACAGGTGTAACAGGTTTTGCTGAACAGGTCAACAGGTTGCGTGTAACAGGTGAATAACAGGTCAAACAGGTAACAGGTAACAGGTAACAGGTTCGCAAGAACAGGTGTAACAGGTCGAACAGGTCTGAATCACCCCAACAGGTACCTCAAGCGATAAGTCCATCAAGAACAGGTCTTGAACAGGTAACAGGTAACAGGTCAACAGGTAAACAGGTAACAGGTGCATAACTAAGGCGCGTCAACAGGTTCGCCTTAGAACAGGTAAAACAGGTAACAGGTGTAACAGGTAACAGGTAAACAGGTGCGAACAGGTAACAGGTCATCCGTCGAACAGGTAAACAGGTTAAACAGGTTGTTGTAACAGGTAACAGGTAACAGGTAACAGGTGAAACAGGTAACAGGTTAAAACAGGTGCAAACAGGTCTAACAGGTAACAGGTTGCCGGTCAACAGGTTAAACAGAACAGGTAATAGCGAACAGGTAAACAGGTTAACAGGTCAACAGGTAAACAGGTGGTAATAACAGGTAAAAACAGGTTATAACAGGTCAACAGGTTAGCGAACAGGTCTAACAGGTGAAACAGGTCTAACAGGTCTAACAGGTAACAGGTAACAGGTTTGAACAGGTGGGAACAGGTAACAGGTACAACAGGTCAACAGGTGAACAGGTAAACAGGTTCGAACAGGTAACAGGTACAACAGGTGAACAGGTCGAAAACAGGTAAAACAGGTTAGTTAACTAACAGGTAAAACAGGTATAACAGGTACCAACAGGTACTCAACCAGAACAGGTAGATGAACAGGTAACAGGTCAGAACAGGTTACACAAAACAGGTAGTAGGGAACAGGTAATGAACAGGTGGTAACAGGTGTAACAGGTCTTCTGGTTGGAAACAGGTAACAGGTGTAACAGGTTGGCTTAAACAGGTAAACAGGTGTAACAGGTGGAAACTAGTTAGTAGATGGAACAGGTAACAGGTGAGGTTTCAACAGGTCCATAACAGGTTATTAACAGGTACCCAACAGGTGTTCTAACAGGTCAACAGGTAACAGGTTAAACAGGTAACAGGTCTAAACAGGTTAAACAGGTAAACAGGTAACAGGTAACAGGTTCAACAGGTACGCAAACAGGTAACAGGTAACAGGTAACAGGTACATCAACAGGTAAAACAGGTGGAACAGGTGTAACAGGTCAACAGGTGCAACAGGTAACAGGTTAGAACAGGTGAACAGGTAACAGGTCAACAGGTCGACTGCAACAGGTAGGGAACAGGTAAACAGGTCGAACAGGTCAACAGGTCAACAGGTCATAACGTTAACAGGTTGTCCATGAACAGGTACGCAACAGGTGAAAACAGGTAACAGGTGAAACAGGTCAACAGGTTGAACAGGTAACAGGTCCCTACGAACAGGTAACAGGTCTAACAGGTTAGGGACGCAACAGGTAACAGGTCAACAGGTATAACAGGTAACAGGTGTGGAACAGGTAACAGGTCTGTAACAGGTCGTGACACTAACAGGTAACAGGTCACTAAAACAGGTCTGAACAGGTAACAGGTGAGGAGTGTGAGAACAGGTTGCATGAACAGGTAACAGGTACAACAGGTGAACAGGTAACAGGTGCATTAACAGGTGAACAGGTCAACAGGTGGTAACAGGTCCACCCCGCCGAACAGGTAACAGGTTAACAGGTTTTAACAGGTCCAACAGGTACAACAGGTTATTTAAACAGGTGAACAGGTATTCAACAGGTGTAACAGGTAACAGGTTGAACAGGTCAAACAGGTTCACACCCCAAACAGGTCACTTTAACAGGTAACAGGTAGCTTCTCACTCAAACAGGTGAACAGGTAACAGGTCCCTGCGAACAGGTAGAACAGGTAACAGGTCGAACAGGTAACAGGTAACAGGTGCCAACAGGTGGAACAGGTTTAACAGGTTAACAGGTGAAAGTTAACAGGTAACAGGTAAACAGGTACTAGAACAGGTAACAGGTTGAACAGGTCAACAGGTTAGGCCAACAGGTATATGGATCGAAGTGTTGAACAAAACAGGTCAACAGGTAACAGGTAGTATTGGATCAGAAACAGGTAACAGGTTGTAAACAGGTAACAGGTAACAGGTTAACAGGTAACAGGTAACAGGTAACAGGTAACCCTTAACAGGTCCCAACAGGTGAAACAGGTCCAGAACAGGTAAGAACAGGTAACAGGTCAACAGGTAAACAGGTACCAAACAGGTGTCTAAAACAGGTCAACAGGTTGGTAACAGGTTGTCTACAACAGGTAACAGGTAACAGGTAACAGGTATAAACAGGTAACAGGTTAACAGGTCAACAGGTCAGGTTTATAAAACAGGTAAACAGGTTAACAGGTAACAGGTAACAGGTATACAACAGGTACTCCCCATGCCTGGGGAAACAGGTAACAGGTCAACAGGTATCCCGGCAACAGGTAACAGGTAACAGGTTAACAGGTGTCAAAACAGGTGTGTATGTTCAACAGGTTGAGTAACAGGTGCTAACAGGTTAAAACAGGTAACAGGTACACAACAGGTTAACAGGTTTACAACAGGTAACAGGTCAAACAGGTGTAACAGGTCACACATAACAGGTCTCAACAGGTCGCCAACAGGTATTCGTGAACAGGTCAACAGGTAAACAGGTAACAGGTAAACAGGTTAACAGGTCAACAGGTAGTAACAGGTAACAGGTCAAAACAGGTAACAGGTAACAGGTAAACAGGTATGCAACAGGTCGTAGCTAACAGGTACGTAACAGGTCAGTTAACAGGTGTGTGTTGAACAGGTGTCAACAGGTCAACAGGTGAACAGGTAAACAGGTAGTAACAGGTAAACAGGTTGAACAGGTTCGTTAACAGGTAGCTAACAGGTCAACAGGTATCAACAGGTCCTCGGCATGAACAACAGGTAAACAGGTAACAGGTCAACAGGTAGCCAACAGGTAACAGGTCAACAGGTGAACAGGTGAACAGGTATATTAAAACAAAACAGGTTTAACAGGTAACAGGTGTGAAACAGGTCCAACAGGTAACAGGTCATAACAGGTAACAGGTCCTCTTGTGCTTTAACAGGTAACAGGTTGAACAGGTAACAGGTTGACATGCAACAGGTAACAGGTTGCGAGGGTCAACAGGTAAAACAGGTGGCCAGTAACAGGTACAACAGGTGACAAACAGGTCATGCCGAACAGGTCCTAACAGGTGTCGCGTGGAACAGGTCAACAGGTAACAGGTATAACAGGTAACAGGTAACAGGTAACAGGTAACAGGTCAACAACAGGTGCACATTGGCGACAACAGGTAACAGGTAAACAGGTCAAATAACAGGTTTTCAACAGGTCTAGCAACAGGTAGAACAGGTTCCGCAAACAGGTGCAACAGGTGGTAGAACAGGTGAGACTCATAACAGGTCATAACAGGTATAAACAGGTAAACAGGTCAGCGCGCTCGTTCAACAGGTAACAGGTTAACAGGTTGAACAGGTTGTAACAGGTCAACAGGTCAACAGGTCAACAGGTATGAACAGGTAACAGGTGGATAACAGGTAACAGGTAACAGGTAACAGGTAACAGGTCCAGTTCAGCAACAGGTTGCTAAGAACTCTGGGAACAGGTTGTATAACAGGTACTCCAACAGGTGAACAGGTAAACAGGTTTGAACAGGTAACAGGTACTAACAGGTAATGAACAGGTAACAGGTATGAACTAACAGGTTAACAGGTATACAACAGGTAACAGGTAAAACAGGTACCCCAACAGGTAACAGGTTGAACAGGTAGCATAGAATCAAACAGGTTATCTATTAATCTAACAGGTAACAGGTTAACAGGTCCAAACAGGTACCTAACAGGTTGACAACAGGTTTTGCATAACAGGTCGAAACAGGTGACCTGTTCGAGAGTAACAGGTAACAGGTGTAACAGGTAACAGGTCTCAACAGGTATAACAGGTAACAGGTAGCAACAGGTAACAGGTCCAACAGGTTAACAGGTACCTTTTGAACAGGTAACAGGTAACAGGTTGTAACAGGTACAAACAGGTAACAGGTAAACAGGTGCTTACAAACAGGTCCCGGCCAACAGGTCATAACAGGTACATAAACAGGTAACAGGTAACAGGTTAAACAGGTAACAGGTAACAGGTAACAGGTAACAGGTGCTAACAGGTAACAGGTAACAGGTTAGGAACAGGTAACAGGTACCAACAGGTCAGAACAGGTTGTAACAGGTGGGCAACAGGTGAAACAGGTATGAACAGGTCACCCCACACGAACAGGTTCAACAGGTACAATATAAACAGGTTGATGAACAGGTTCAGCGAACAGGTGCGAACAGGTAACAGGTACAACAGGTAACAGGTAACAGGTAACAGGTTTAAACAGGTGGCTAAAAACAGGTAAAACAGGTGTTAAAACAGGTCTCGCCGCTAAACAGGTAAGAACAGGTTAAAACAGGTCAGCAACAGGTCCTAACAGGTCAACCTCTGGGCTCTAACAGGTTAACAGGTGTGCAACAGGTAACAGGTTTTAACAGGTAGAACAGGTGCGTTCACAACAGGTTGAACAGGTAACAGGTCAACAGGTGACAAACAGGTACGTAAAACAGGTAACAGGTAACAGGTCTTGTAACAGGTAACAGGTCAAACAGGTACGGTAACAGGTCCAAACAGGTGGACAACAGGTCTAACAGGTTAACAGGTAACAGGTGGAACAGGTCATGAACAGGTTTAAGAACAGGTAAACAGGTATAGACAACAGGTCAAACAGGTAACAGGTAACAGGTAACAGGTGAACAGGTTAACAGGTAACAGGTCAACAGGTGGGACTGAACAGGTTGCACAACAGGTTAGGAACAGGTTAACAGGTTTAACAGGTAGAACAGGTAACAGGTAACAGGTAAACAGGTAACAGGTAACAGGTGAACAGGTATGTGTAACAGGTGAACAGGTAGAACAGGTCACACAACAGGTCAACAGGTCCCAACAGGTAACAGGTCTAGAACAGGTTAACAGGTAACAGGTAAGTCAACAGGTTAAAACAGGTCAGCCGTTGCAACAGGTAACAGGTAACAGGTTTAACAGGTAACAGGTAACAGGTAACAGGTGACCCAACAGGTCTGAACAGGTCACAACAGGTAACAGGTCAACAGGTCTCCCGAACAGGTGAAACAGGTAAACAGGTGTAACAGGTAACAGGTGCGTAACAGGTACGATGGGGCAGTTTCAGGGCTGAACAGGTAACAGGTAACAGGTAGACGAACAGGTTACACATTAGTAACAGGTTGGAAACAGGTGAACAGGTGCACAACAGGTCAACAGGTTAACAGGTCAACAGGTGAAATGAACAGGTCGCCAAACAGGTCTACAACAGGTGGAAACAGGTCTGAACAGGTCATGAACAGGTGAACAGGTTAACAGGTCTTCAACAGGTAACAGGTAACAGGTAACAGGTGCAACAGGTGTTGCAACAGGTAACAGGTGAACAGGTTAACAGGTAACAGGTGCTGCTAACAGGTAACAGGTTAACAGGTGAACAGGTGCCAAACAGGTCTTAGACAGTTACATAAGAACAGGTCAACAGGTTGGGAACAGGTTAACAGGTGGGAACAGGTAACAGGTAACAGGTAAACAGGTGGCAACAGGTCGAACAGGTTCAACAGGTTGGAACAGGTGAGAACAGGTAAAACAGGTAACAGGTAGGAAAACAGGTTCAACAGGTATGGGAACAGGTGAAACAGGTAACAGGTTAGTAAACAGGTCACTGAACAGGTGGGGAACAGGTAACAGGTAACAGGTCCGAACAGGTGCAAACAGGTGAAACAGGTAAACAGGTACCGAAAACAGGTAACAGGTAACAGGTAACAGGTAGGCTACAACAGGTTAACAGGTCCCCAACAGGTC","AACAGGTAA")
In [429]:
def kmer_clumps(genome, k, L, t):
""" Find patterns forming clumps in a string """
clumps = list()
for i in range(len(genome) - L + 1):
mini_genome = genome[i:i+L]
kmers = dict()
for j in range(len(mini_genome) - k + 1):
kmer = mini_genome[j:j+k]
if kmer in kmers:
kmers[kmer] += 1
else:
kmers[kmer] = 1
if max(kmers.values()) >= t:
keys = [kmer for kmer,value in kmers.items() if value >= t]
for key in keys:
if key not in clumps:
clumps.append(key)
return " ".join(clumps)
In [198]:
#%%timeit
s = "CGGACTCGACAGATGTGAAGAAATGTGAAGACTGAGTGAAGAGAAGAGGAAACACGACACGACATTGCGACATAATGTACGAATGTAATGTGCCTATGGC"
kmer_clumps(s, 5, 75, 4)
In [419]:
%%timeit
s = "CCAAACGAGGCATTGGCGGGGGATTGAAATTCTTGATGGCTGAGCACTGACTGAGCACTGGAGGATCTGAGCACTGCTGAGCACTGAGGCTCGATGGCCATAAAAAACCCTGATGGGTGGATCTGAGCATAAAAAAACTCCCGGGCATAAAAAATCATAAAAAAGCACTGCATAAAAAAACTGCATAAAAAACGTAGTCCTGCAGATCAGATGGGTGGCCATAAAAAACATAAAAAACACTGGTAGATGGGTGCATAAAAAACATAAAAAAGAGCACTGGTGGGCATAAAAAACTGCATAAAAAAAGACGCTACACATAAAAAAGGGCATAAAAAACCTGAGCACTCTTCTGAGCACTATGGGTGGGCTCATAAAAAAAACCATAAAAAACATAAAAAAATGGGTCTGACTGAGCACTCACTCAGATGGGTGCTGCATAAAAAACATAACATAAAAAAAGCACTAAGCTCTGGATGGGTGGGACTGAGCACTCATAAAAAAACCTGAGCATAAAAAATGAGCACTACGTTCATAAAAAAGATGGGTGGGGCTGAGCATAAAAAAAAAAACATAAAAAATGGGTGATGGGTGGGGTCTTCAATAACATAAAAAATAAAAAAATGCGCCGGTCCATAAAAAACATAAAAAAAACATAAAAAAATAGGTCTTGTCTTCAACATAAAAAAGCAAACTTGGTCTTCAATCATGACGTATGGTCAAGGGCTTGGATAAGTCTTCAATGTCTTCAATAATGAGCAGGCTTCGTCTTCAATAATTCAATCCTGTTCATCGTCTTCAATAAATTGGAGGTTAGCATGGGAAAGGTCTTCAATCTTCAATGGGGACGGTCTTCAATTTTTGAGGCTGATAACGATAGTCTCGGGTGTCTTCAATGTCTTCAATTCTTCGATTTGTCTTCAGTCTTGTCTTCAATGATTTCCAGGGAGTGATCTGGTGACGCTTTCTCCGGGTCTGTCTTCAATCGTCTTCAATGTCTTCAATCACGGTCTTCAATTATGCGGGGGCCGGCTCCACGGTGTTTATTCGAGTTTACACCTGGGAGTTTAGAACGCCACGAGTCGTCTTCAATTATCTCCATTAGTAGTCTTCAATCTGCAATCCAGTCTTCAAGTCTTCAATAATTTCGGATGCAGTCTTCAATGCGTTGCGCACTTAACGGCAGTTCCCCATTTTTCGCGTAATCCGGCATGACGCTGGACCGTTGGTTACGGGGCTCGTTGGAAGGCCCGTGGCTGGCTAGGCATTGGGATCATGTAATGTTATATCCTTCGGCTCGCGTATGCATCCTTGCATCTTGCATACTGCATACCCTCTTGCATACCTTGCATACACGGCCCTCACCACTTGAGACCGCCGCAACGTGCGACTTGCATACCTGCTCCCAAGGTGTGATTTGTTGTTACATGTGATCCTTGCATACTTATCCTTGCATACTACGTTTCAACGAGGCTCTTGCATACTGAGTTGGCTGGTCCCTCTTGCATACTACCCTCGCCCCAGTAGGTGGTGTAAACCTGCCTCTGTGTTCGAGCTTGCATACAGTCCCACGGCTTGCATACCACTTGCATACTTGCTTGCATACAAAGTCTGACTTGCATACTCACCACCGCTTGCATACCCGATCAATTCCCTGCGGCCTTGCATACATGGCCGTGATTATTGCCGCTAGCGCCTTTACCATGGACACCACCGGCACCACAAGAGAGGCCTCTTGCATACGCCCGGGCTGTCTTGCATACTGAATGCGTGTCAAGTTATTCTCTCTTGGTCCTTGTCAGCAAACTTGCATACCAGCAGGGGGAAGCTTGAAGGCTGCTTGCGTCCTTGTCGTAGACCTGTCCTTGTCTATTGTGGACCTTATCTTGGTCCTTGTCGTCATACAGAGTGTGACCAATATGTTCCCCCGTGAGATCTCGTTGGCGTCCTTGTCCCGCTTTCGAAACGCGGTTCCTGGCTTATCGTCCTTGTCTTGTCCTTGTCGTCCTTGTCGTCCTTGTCGTCGCGGTCCTTGTCCCTTTGTTCTTGTCCTTGTCTGTCCTTGTGGTCCGTCCTTGTCCGAAGATCAGTCCGTCCTTGTCTCAGGCGGCGTGTACTTAGGGCAAGTCCTTGTCAGAGATCAGGGAAGATCAGAAGATCAGTGTCCTTGTCGTCCACGGTCCTTGTCATCAGGGTGAAGATCAGGAGTAGAAGATGGTCGTCCTTGTCGAAGATCGTCCGTCCTTGTCTCTGTCCTTGTCATAGCTGAAGATCAGGTCCTTGTCGGGAAGATGAAGAGTCCTTGTCGAAGATCAGGACCGAAAACCGAAAACCAACGAAGATCAGGAAAAGAAAACCAACGAAAACCAATTAGAGAAGATCAGGAAGATCAGCGCTTGGGCATAATGAAGATCAGAGTCAGATGAAGATCAGCAGTGGAAAACCAGAAAACCAAACCCTACCTCAGGATGAAGATCAGAAACCAAAAAAACCAATGAAAACCAAAAATATAGTCGAAGATCAGAAACCAAAACCAAACAAAGAAGATCAGCCGCCGAAGATCAGGAAGATCAGGTTATAGTTGTGAAAGGTTTAATGAAAACCAAAATCGTGAAGAAAACCAAAAAACCAACCAAGCGAATGTATTCGCTATCGTGACTGGAAAACCAAAGCCACTTAATATCGATGGGGCTTGACGAAAACCAAAGGAAAACCAAGTGGGAAAACCAACGACGCCTAGCTACCAGAAAACCAATACGCACAGCCCCTGGGACCACAAGAAGAAACTTACAGCGGAAAACCAAAAACCAACGGATATTCTAGCTGTCAGTTACATTTTGGAAGTTCCTTCAGAAAACCAAAGTAAGAAGCACATCTACTACCGCGCTAACATTCTTGCTGAATATAGAGTCGTTGTTTGGATTACCTCCAGTACTACTGCGTTCTTTGGATTAAAATTTGGATTACTGGAACACAAACATTTGGATTAATTAACCCTGATCTCTGGCGGTAAACGGTTTGGATTATTGTTTGGATTACAGTTATTCCGGGGATTAGATATACTGCCAGCTATTTTGGATTATTATGCTATCTTTTGTTTGGATTATTATCCTAGAAACTTTGGATTTTTGGATTAAATACCGAAATGCTTGAGACGTGTGGATTGTTTAACCAAGCATTTGGATTATACATTTGGATTAATTTTTGGATTATTGGATTAGATTTATTCCGGTCGCTTCTCGCTTTTTTGGATTATAGCAGTTATTTTGGATTACACCGCCCAGAATAACGAGCACTTGGCTTAGCTAGCTTTGGATTAGATTATGTCCTTTGGATTAGCATTCACACCATCGCGATTGGAAGGCTCAATTTTGGATTAAACCATTGACAATGGAGCCCACAGCACGTTTGGATTAGTGGGTCACTTTGGATTATTTGGATTATTTTTGGATTATATTTTGGATTTTGGATTATTATTGCTCGGGATTTCTAACTATGAACCAATTCTAAACAACTAACTATGCTAACTATGATGTTTTGCGCGTTAATCTCCCTAACTATGGACGGGAGCGCTTGCCGGTCGACTAACTATGAGCGTCAAGTGGTCGAAAGGGCCTAACCGCCTAACTATGGCTAACTATGCGACCTAGTAGCATGAAAACAACAACTATGCCTAACTATGACTAACTATGACTAACTATGGTGTTACACAAGTATCATTAGCATAAGCCACCTAACTATGCAATGTCCGGGGTAGTTACATAGTCGTGGACTACATTCTAACTATGACTGGTGCCTAACTATGTAGTCCTAACTATGCTACTAACTATGTATGTCCTAACTATGTGCCATGCCCAAGCTAACTATGCCTAACTATGCCTAACTATGTGGACGGCATACGTATTGCGTATAAACGCAATATGTATTGCTAAACGCAATTGTGCACGTATAAACTAACTATGTCGAAACCCCACTAACTATGTAACCTAACTATGCAATTATCCTGCTAACTATGCTAACTATGAAACGCAAATTGCGTGGAGGTCTCTAACTAACTATGGCAAGTATAACTAACTATGCGTAAACGCAAGCAAAGCAATGCGTTGGTATGCTAAACGCAATGTATTGCGTATGCGGCAGTACCGTTAAACGCAATATTGCGTGACGATAGTCCATAAACGCAATCTGTCCCGGAAGTTCCGTCACCTTAAACGCAATGTAAACGCAACCATGCTTTGTATTGCGTTAAACGCAACGCAATTAAACGCAAGCGTATTGCGTAGTTTGGTATTGCGTGTATTGCGTGGATCCGTGGAATAAACGCAATTATTGCGTTGGTTTCCTTGCTCCGGTGTTAAACGCAAGCCTCCCGCAGTATTGCGTCAAGTTAAATAAACGCAATAATCTCCCGATCTTAAATAAACGCAAACTCACGCAGGTTTTTTAAACGCAAGCAATTGCGTTTCACTTAAACGCAAGCAATAATGCGCACCCAGCATTAAAGCCTATGGACGCTCCCTTCATATTATAGTCTTATGTGTGCAACCGGTTGCCAGACCTATAAAATCATGACAGAAATTGGGAAACAGTCCAATGCTAATCATCTGTTCAGGTGGCTGGACACAGTCCAATGTGTCAATGTACGGACGTCACATTCGCTAAGGGCTATGGTATTATTGAGAAGACTTCACAAGCTTTTAACGATAAGCCGGCTCGGAGTCTGCTTCAAAAATCCGAGCCACCCATCCACAGCTGTGGTTGTCAATCGTCTGTCACTACAAGGTTGCCCATTCCTGAATGTTAAGCTAAAGAATCGAGGGACGACAATATCGTGCGCCTCTAACCTTAGACTCCATCGTGTCGACTGTGATTTACCGCACCTCTCCGGCCTCGTTAATCGTGATAGTAGTACGCGGTCAATTGAATCCAAGTAATCTTGATTTGGAACAAGGTAATGACACTACACATTACGGAGACAGAGCCCACCGAGTCATGAGAGTATTTTAACTTTGCAAGGGCCTCGATCTGATGCGGATTACTCCGACATGCCTATGCTGATGTACCTCATGGTCTCCTCCCACGATAGTCGTGAGACCCTACAGAGGCCGCGTCCCCCTTATTTCCTGAGTATCCGCACCCCTAGGAATTACGTGTAAGACGTGATACCACAGATCGGTACTCCGACGGCCTCGGGGAACCAGGCGGTTTATAGTTTAGTCATGGAACTCATGTAAATCGAATTGCAGGAGCCTACCCATCGGTGCTGATCGTCTTGGTGAAATACCCTATAAAGATACTGGCGCTACCTCACCTGTACCTTTTCGTTTGCGCCGTTAAATCGGAAATGGGGGTACCATGTACCCTCTAAATCCGCCTGGCATCCGCCAAGGTATAAAGTGATTGCTGCGTGTGAAGAGGATCTAGTCGATTTTCGCAGTGGCGAGCTACGTAAACGTTCTCACCTGCCTGAGAGTTAATGAGTAACAGATATCGTATTAGTGTGCCACTCATGCGCTCTACAACCCTAAACTCAACTGGCCTTACGGCCGAGCCTATGCGAGTAATGAGTTCGCTCCAAAGGAAGACACCCACAAGCTGTTGGATAGTGGCCCCTCGGACTGTTCGCCGCATAAAGGGTGATGCAACAACCTCAACGTAGGAAATTCCTGACGGTCTCAATCTACGAGTATTTTTCTTACCCGGCGCGCAGGGGCTCAATCGGATCCTGTGGGCACCCGACCTTGCTACTCGGAACTGACCGAGAGAACTAACGAAATTTCGTGATCGTGATGACCGAGACGTCTTGTCTTTATGCATGACCGAGAGACTGACCGAGATAGGCCCTACACTGACCGAGACCCGGGCGTGTCTCACTGGCGAATTACGTAGAGCGAGTTCGTGACCGAGATAGTCAATGATGACCGAGACTAGTGATTAAGCTTTGACCGAGACCCATTTTGTAAGCTAGTACTGAACTTAAGCTAGTTTTCTGACCGAGATGACCGAGAAAGTAATGACCGAGACTAGTTCGTTGACCGAGAGACCGAGATCTGTGACCGAGAAGACTGACCGAGATGTAAGCTAGTTATATGACCGAGATATGACCGAGACGCAAAATGACCGAGAAGTTGACCGAGATCAGGTTTGATGACCGAGAAAGTCCGAACCCGTGGATTAAGCTAGTGTAATAATATGACCGTGACCGAGAGTGACCGAGAGTGCTAAGCTAGTGACCGAGATAGTAAGCTAGTGATTAAGCTATGACCGAGAGAAGATCGATTTAGCCAACTCCACTGACCGAGACGAGAAACGCTGCTATCCCGTTGACCGAGAACTTACAAAGGGTTTCATGTGTTCTCATAAGCTTAAGCTAGTCTAGTGGTAGTATTAAGCTAGTCTCCGCCTATCTGCGTCTTAAGCTAGTAGAGGTTCGTCTCCTATCCGCCTCTAAGCTAGTTATAAACCTCAAGAGTCTGAATGGATATACTTATATCTCTACTCACTTGGCCGGCACCCCGATGGATGGTCCGTCCAAGAACTTTTTTGTCCCAATTCTAACTCAGGTTCATAAGCGACTCTTGGTGGAACCCTACTACGCTACTACGACTACGATATCGTCCTGTACAGGACTACTACGATACGATACTTCGGGCGACGGACTGCTACTACGAGCTACTACGACGAGGATTTTGGAAGTATCTTCCGTAACTACTAGACCATCACTTGAGCTCGCGCCCCTGATCTACTACGAAATTACTCTACTACGACGAGGGGTCTACTACGACCTACTACGAACAATCGTAGACACAGAGTTGACGCAAGACCCCCCGGCTACTACGAGCTACTACGATACGAGCAGGCTCATTCACTGGGAGGCGGTTAACATGCCATCGTATACTACTACGAGGAAAACCCGTTGCTACTACTACGAGGTCAGAGTTGCTACTACGAGTTTATTGCACAGCAGATGAGGTCTACTACGAAGAACGCCCTACTACGAGACAGCTACTACGACTACTACGATGGCTTGATTACTGCGAAGATGGCCAGCTAGGTGACTGGCGCATATAGACCACGACGGCTACTACGATACGACCATGGTGACGAGGTTACCCTACTACGAACACTCTACCTACTACGATCGGGCTCTACTACCTACTACTACTACGAAAGAGTAACAGTCCGTAAGATAGGTCACCATTGGGGCCGCCTCCGAGTGTGGAAAGCCCGGTGAGAACGATCTAACCGTACACGATTAGTGTTTCTCGTAGCCTTTAAACGAAATACGAGGCACCGTCGGCGCTCGAACAGACGGTCTTGCTGTGCCCGGCCATCTCACTAGCAGTACAGGGTAGTCTGTGCCAAAGCATGACCCTACGACCCGAAGATATCCCGCTCAACTGTCTAAAAATTCCAATGAGACTGACTCACTAGCTACTCTTGGAACGACCACTCGTGCATAGGTTCTCTCGTCCTTCTATATAACAGTATGTCGGCGGCCCTATCTTTGCATGAGCGTGCAGCCGTATGCTACAGTGTGCAGTAAGAACTATTAGGGAAGCCTCAGCCCCCCTAACACCGCGCTGTGCTTATACGATGAAAGGCTCTACACAAACACCGTACAGTCTGTGCAGTCCCACGTGCACTTTTGTTCATTGTATGGCTGGTCTACTTTTCAATGACATGGATAATCCACGGGTGCATTAGTAACAGACATCGTCGGCATTGCCCAGTCTGTTCCACCGTTGTCGGAGTGCCCTCATGAGTGTTCTGAACAAAAGAATGTGAGTATCTTGTAACGGATCAGAGTGCAAGGTGTCATTGGCCCCTGGTGGGCCCCTGGTCCCGTAGAACCCAACGTGACGCCCCTGGTCTGGTACAAGCGTAAGACTTAGGCCCCGCCCCTGGTCGCTACGCCCCTGGTACTCCATGCGCCCCTGGTTGCCCCTGGTGCAAGCAAGTTACGACATCACGGCCGACCGCTGGAGCCTCGAACGAGAGCCCCTGGTCTTCATGCCCCTGGTGGCCCCTGGTAAGAGAGCCCCGCCCCTGGTGTGGGTTAATATCACGATTGCTGAGCTGACGCCCAGGTTTGGTAAGGCCCCTGGTTTTGATGCGCCGCCCCTGGTGCGATGAGCTCCATTACTCCGGACGCGCCCCTGGTGTGAGCTATAGTTAGGACTGCTACGCGCCCCTGGTAACGACGTATGCGGCCCCTGGTCCAGGGGCTAGCCCCTGGTCCTGGTTAGTAGTACGGCCCGACGATACCTTGCCGCCCCTGGTCCTGGTCTACCGCAACTCACCGGTTGGCTAGGTTGTATGACGACTGAGTTGTAAGCCCCTGGTGAAATCGCCCCTGGTCTTATAAAGCCCGCCCCTGGTGGTGCCCCTGGTCCCTGGTTTGAGCCCCTGGTACAGCAAGTGATTGCGTAAGTCTGATTGACAAAACGATTGAGGGCTCGTACTATTCCATTCGGTTACGCGCTCGCCCATACCACCGCTCGTAGTACGCGGTATTGATCATCCCCCGCATTTTGCGTATCGGCTCCGATAGTAATGACCCGGAACGCTCAATTGGTCAGGGGCCGCCCCGTTAATCGCATATGATTGGTCACTGGAGCCATCAGCCCTGGGGGTGGCAAGCTAAAGAGCACCACAGCCCCATTCGGCGAGCCGGCTCGACTTACGTATCACCATAATGGAGCAGCAAGGCAGTTTGGTAAAGACCAGATGAAGGAAGGGTCGCGCCCGTCGCATCGACCGTGCTTATATCGCACGTGGACGCCTCACTCACCAGGACATATTGCGACATGATTACCAAATTGCACCGGGATAATCGTCTGACCCGCAGGGAGCAGGTTTGAGCTTCGGCTCTTATTTAGTACTTGAGGGAGCAGGCAGAGGGAGCAGAAGGGAGCAGGAAGAAGTACTTGCAGTCTGGTATTCCATCACTATGGATAAGGGAAGGGAGCAGGAGGGAGCAGCCAAAGGGAGCAAGGGAGCAGCCCGGTTGATAGCGTCTCTTAAGAGGGAGCAGGACAGTAGGGAGGATGGCGGAACCCGGATTTAGTTAGGAGGATGGCGGTGCAGGATGGCGGGCAGGGAGCAGGGATGGCGGTGAGAGGGAGCAGAACTGGTGATTCACCTGTGATTCACGGTGATTCACGGCGGATGGCGTGATTCACAGCAGGGTTAAGGTAGGGATGGTGATTCACGATGTGATTCACAGGGAGCAGGCTCCGGGCGGGTGATTCACGGGGTGATTCAGTGATTCACGGGGAGTGATTCACGGGAGCAGGGATGGCGGGGGGTGATTCACCACGGGCCGTTGTGAGTGATTCACGGATGTGATTCACAGTGATTCACATGGCGGGTTGTTGTGATTCACGATTCACAAGGGAGCAGAGGGAAAGTGATTCACACGCCGTTCGGGTTCCCAACTGGGAGGATGGCGGTTAAGGATGGTGATTCACGGGTTCGGGTGATTGTGATGTGATTCACGAGGATGGCGGGCGGTGACGACGTGATTCACGAAGTGATTCACATGGCGGGCCGGATGGCGTGATTCACTGATTCACGGACTATGGTGATTCACGATGGGTGATTCACCGTTTGTAAATCCGCGGGCCGTTGTTTTATACCGGGCGTGATTCACACTGTGATTCACTCGGGCCGTTCGGGCCGTTGTGATTCACCGGGCCGTTCGGGCCGTT"
kmer_clumps(s, 9, 516, 19)
In [430]:
%%timeit
s = "CCAAACGAGGCATTGGCGGGGGATTGAAATTCTTGATGGCTGAGCACTGACTGAGCACTGGAGGATCTGAGCACTGCTGAGCACTGAGGCTCGATGGCCATAAAAAACCCTGATGGGTGGATCTGAGCATAAAAAAACTCCCGGGCATAAAAAATCATAAAAAAGCACTGCATAAAAAAACTGCATAAAAAACGTAGTCCTGCAGATCAGATGGGTGGCCATAAAAAACATAAAAAACACTGGTAGATGGGTGCATAAAAAACATAAAAAAGAGCACTGGTGGGCATAAAAAACTGCATAAAAAAAGACGCTACACATAAAAAAGGGCATAAAAAACCTGAGCACTCTTCTGAGCACTATGGGTGGGCTCATAAAAAAAACCATAAAAAACATAAAAAAATGGGTCTGACTGAGCACTCACTCAGATGGGTGCTGCATAAAAAACATAACATAAAAAAAGCACTAAGCTCTGGATGGGTGGGACTGAGCACTCATAAAAAAACCTGAGCATAAAAAATGAGCACTACGTTCATAAAAAAGATGGGTGGGGCTGAGCATAAAAAAAAAAACATAAAAAATGGGTGATGGGTGGGGTCTTCAATAACATAAAAAATAAAAAAATGCGCCGGTCCATAAAAAACATAAAAAAAACATAAAAAAATAGGTCTTGTCTTCAACATAAAAAAGCAAACTTGGTCTTCAATCATGACGTATGGTCAAGGGCTTGGATAAGTCTTCAATGTCTTCAATAATGAGCAGGCTTCGTCTTCAATAATTCAATCCTGTTCATCGTCTTCAATAAATTGGAGGTTAGCATGGGAAAGGTCTTCAATCTTCAATGGGGACGGTCTTCAATTTTTGAGGCTGATAACGATAGTCTCGGGTGTCTTCAATGTCTTCAATTCTTCGATTTGTCTTCAGTCTTGTCTTCAATGATTTCCAGGGAGTGATCTGGTGACGCTTTCTCCGGGTCTGTCTTCAATCGTCTTCAATGTCTTCAATCACGGTCTTCAATTATGCGGGGGCCGGCTCCACGGTGTTTATTCGAGTTTACACCTGGGAGTTTAGAACGCCACGAGTCGTCTTCAATTATCTCCATTAGTAGTCTTCAATCTGCAATCCAGTCTTCAAGTCTTCAATAATTTCGGATGCAGTCTTCAATGCGTTGCGCACTTAACGGCAGTTCCCCATTTTTCGCGTAATCCGGCATGACGCTGGACCGTTGGTTACGGGGCTCGTTGGAAGGCCCGTGGCTGGCTAGGCATTGGGATCATGTAATGTTATATCCTTCGGCTCGCGTATGCATCCTTGCATCTTGCATACTGCATACCCTCTTGCATACCTTGCATACACGGCCCTCACCACTTGAGACCGCCGCAACGTGCGACTTGCATACCTGCTCCCAAGGTGTGATTTGTTGTTACATGTGATCCTTGCATACTTATCCTTGCATACTACGTTTCAACGAGGCTCTTGCATACTGAGTTGGCTGGTCCCTCTTGCATACTACCCTCGCCCCAGTAGGTGGTGTAAACCTGCCTCTGTGTTCGAGCTTGCATACAGTCCCACGGCTTGCATACCACTTGCATACTTGCTTGCATACAAAGTCTGACTTGCATACTCACCACCGCTTGCATACCCGATCAATTCCCTGCGGCCTTGCATACATGGCCGTGATTATTGCCGCTAGCGCCTTTACCATGGACACCACCGGCACCACAAGAGAGGCCTCTTGCATACGCCCGGGCTGTCTTGCATACTGAATGCGTGTCAAGTTATTCTCTCTTGGTCCTTGTCAGCAAACTTGCATACCAGCAGGGGGAAGCTTGAAGGCTGCTTGCGTCCTTGTCGTAGACCTGTCCTTGTCTATTGTGGACCTTATCTTGGTCCTTGTCGTCATACAGAGTGTGACCAATATGTTCCCCCGTGAGATCTCGTTGGCGTCCTTGTCCCGCTTTCGAAACGCGGTTCCTGGCTTATCGTCCTTGTCTTGTCCTTGTCGTCCTTGTCGTCCTTGTCGTCGCGGTCCTTGTCCCTTTGTTCTTGTCCTTGTCTGTCCTTGTGGTCCGTCCTTGTCCGAAGATCAGTCCGTCCTTGTCTCAGGCGGCGTGTACTTAGGGCAAGTCCTTGTCAGAGATCAGGGAAGATCAGAAGATCAGTGTCCTTGTCGTCCACGGTCCTTGTCATCAGGGTGAAGATCAGGAGTAGAAGATGGTCGTCCTTGTCGAAGATCGTCCGTCCTTGTCTCTGTCCTTGTCATAGCTGAAGATCAGGTCCTTGTCGGGAAGATGAAGAGTCCTTGTCGAAGATCAGGACCGAAAACCGAAAACCAACGAAGATCAGGAAAAGAAAACCAACGAAAACCAATTAGAGAAGATCAGGAAGATCAGCGCTTGGGCATAATGAAGATCAGAGTCAGATGAAGATCAGCAGTGGAAAACCAGAAAACCAAACCCTACCTCAGGATGAAGATCAGAAACCAAAAAAACCAATGAAAACCAAAAATATAGTCGAAGATCAGAAACCAAAACCAAACAAAGAAGATCAGCCGCCGAAGATCAGGAAGATCAGGTTATAGTTGTGAAAGGTTTAATGAAAACCAAAATCGTGAAGAAAACCAAAAAACCAACCAAGCGAATGTATTCGCTATCGTGACTGGAAAACCAAAGCCACTTAATATCGATGGGGCTTGACGAAAACCAAAGGAAAACCAAGTGGGAAAACCAACGACGCCTAGCTACCAGAAAACCAATACGCACAGCCCCTGGGACCACAAGAAGAAACTTACAGCGGAAAACCAAAAACCAACGGATATTCTAGCTGTCAGTTACATTTTGGAAGTTCCTTCAGAAAACCAAAGTAAGAAGCACATCTACTACCGCGCTAACATTCTTGCTGAATATAGAGTCGTTGTTTGGATTACCTCCAGTACTACTGCGTTCTTTGGATTAAAATTTGGATTACTGGAACACAAACATTTGGATTAATTAACCCTGATCTCTGGCGGTAAACGGTTTGGATTATTGTTTGGATTACAGTTATTCCGGGGATTAGATATACTGCCAGCTATTTTGGATTATTATGCTATCTTTTGTTTGGATTATTATCCTAGAAACTTTGGATTTTTGGATTAAATACCGAAATGCTTGAGACGTGTGGATTGTTTAACCAAGCATTTGGATTATACATTTGGATTAATTTTTGGATTATTGGATTAGATTTATTCCGGTCGCTTCTCGCTTTTTTGGATTATAGCAGTTATTTTGGATTACACCGCCCAGAATAACGAGCACTTGGCTTAGCTAGCTTTGGATTAGATTATGTCCTTTGGATTAGCATTCACACCATCGCGATTGGAAGGCTCAATTTTGGATTAAACCATTGACAATGGAGCCCACAGCACGTTTGGATTAGTGGGTCACTTTGGATTATTTGGATTATTTTTGGATTATATTTTGGATTTTGGATTATTATTGCTCGGGATTTCTAACTATGAACCAATTCTAAACAACTAACTATGCTAACTATGATGTTTTGCGCGTTAATCTCCCTAACTATGGACGGGAGCGCTTGCCGGTCGACTAACTATGAGCGTCAAGTGGTCGAAAGGGCCTAACCGCCTAACTATGGCTAACTATGCGACCTAGTAGCATGAAAACAACAACTATGCCTAACTATGACTAACTATGACTAACTATGGTGTTACACAAGTATCATTAGCATAAGCCACCTAACTATGCAATGTCCGGGGTAGTTACATAGTCGTGGACTACATTCTAACTATGACTGGTGCCTAACTATGTAGTCCTAACTATGCTACTAACTATGTATGTCCTAACTATGTGCCATGCCCAAGCTAACTATGCCTAACTATGCCTAACTATGTGGACGGCATACGTATTGCGTATAAACGCAATATGTATTGCTAAACGCAATTGTGCACGTATAAACTAACTATGTCGAAACCCCACTAACTATGTAACCTAACTATGCAATTATCCTGCTAACTATGCTAACTATGAAACGCAAATTGCGTGGAGGTCTCTAACTAACTATGGCAAGTATAACTAACTATGCGTAAACGCAAGCAAAGCAATGCGTTGGTATGCTAAACGCAATGTATTGCGTATGCGGCAGTACCGTTAAACGCAATATTGCGTGACGATAGTCCATAAACGCAATCTGTCCCGGAAGTTCCGTCACCTTAAACGCAATGTAAACGCAACCATGCTTTGTATTGCGTTAAACGCAACGCAATTAAACGCAAGCGTATTGCGTAGTTTGGTATTGCGTGTATTGCGTGGATCCGTGGAATAAACGCAATTATTGCGTTGGTTTCCTTGCTCCGGTGTTAAACGCAAGCCTCCCGCAGTATTGCGTCAAGTTAAATAAACGCAATAATCTCCCGATCTTAAATAAACGCAAACTCACGCAGGTTTTTTAAACGCAAGCAATTGCGTTTCACTTAAACGCAAGCAATAATGCGCACCCAGCATTAAAGCCTATGGACGCTCCCTTCATATTATAGTCTTATGTGTGCAACCGGTTGCCAGACCTATAAAATCATGACAGAAATTGGGAAACAGTCCAATGCTAATCATCTGTTCAGGTGGCTGGACACAGTCCAATGTGTCAATGTACGGACGTCACATTCGCTAAGGGCTATGGTATTATTGAGAAGACTTCACAAGCTTTTAACGATAAGCCGGCTCGGAGTCTGCTTCAAAAATCCGAGCCACCCATCCACAGCTGTGGTTGTCAATCGTCTGTCACTACAAGGTTGCCCATTCCTGAATGTTAAGCTAAAGAATCGAGGGACGACAATATCGTGCGCCTCTAACCTTAGACTCCATCGTGTCGACTGTGATTTACCGCACCTCTCCGGCCTCGTTAATCGTGATAGTAGTACGCGGTCAATTGAATCCAAGTAATCTTGATTTGGAACAAGGTAATGACACTACACATTACGGAGACAGAGCCCACCGAGTCATGAGAGTATTTTAACTTTGCAAGGGCCTCGATCTGATGCGGATTACTCCGACATGCCTATGCTGATGTACCTCATGGTCTCCTCCCACGATAGTCGTGAGACCCTACAGAGGCCGCGTCCCCCTTATTTCCTGAGTATCCGCACCCCTAGGAATTACGTGTAAGACGTGATACCACAGATCGGTACTCCGACGGCCTCGGGGAACCAGGCGGTTTATAGTTTAGTCATGGAACTCATGTAAATCGAATTGCAGGAGCCTACCCATCGGTGCTGATCGTCTTGGTGAAATACCCTATAAAGATACTGGCGCTACCTCACCTGTACCTTTTCGTTTGCGCCGTTAAATCGGAAATGGGGGTACCATGTACCCTCTAAATCCGCCTGGCATCCGCCAAGGTATAAAGTGATTGCTGCGTGTGAAGAGGATCTAGTCGATTTTCGCAGTGGCGAGCTACGTAAACGTTCTCACCTGCCTGAGAGTTAATGAGTAACAGATATCGTATTAGTGTGCCACTCATGCGCTCTACAACCCTAAACTCAACTGGCCTTACGGCCGAGCCTATGCGAGTAATGAGTTCGCTCCAAAGGAAGACACCCACAAGCTGTTGGATAGTGGCCCCTCGGACTGTTCGCCGCATAAAGGGTGATGCAACAACCTCAACGTAGGAAATTCCTGACGGTCTCAATCTACGAGTATTTTTCTTACCCGGCGCGCAGGGGCTCAATCGGATCCTGTGGGCACCCGACCTTGCTACTCGGAACTGACCGAGAGAACTAACGAAATTTCGTGATCGTGATGACCGAGACGTCTTGTCTTTATGCATGACCGAGAGACTGACCGAGATAGGCCCTACACTGACCGAGACCCGGGCGTGTCTCACTGGCGAATTACGTAGAGCGAGTTCGTGACCGAGATAGTCAATGATGACCGAGACTAGTGATTAAGCTTTGACCGAGACCCATTTTGTAAGCTAGTACTGAACTTAAGCTAGTTTTCTGACCGAGATGACCGAGAAAGTAATGACCGAGACTAGTTCGTTGACCGAGAGACCGAGATCTGTGACCGAGAAGACTGACCGAGATGTAAGCTAGTTATATGACCGAGATATGACCGAGACGCAAAATGACCGAGAAGTTGACCGAGATCAGGTTTGATGACCGAGAAAGTCCGAACCCGTGGATTAAGCTAGTGTAATAATATGACCGTGACCGAGAGTGACCGAGAGTGCTAAGCTAGTGACCGAGATAGTAAGCTAGTGATTAAGCTATGACCGAGAGAAGATCGATTTAGCCAACTCCACTGACCGAGACGAGAAACGCTGCTATCCCGTTGACCGAGAACTTACAAAGGGTTTCATGTGTTCTCATAAGCTTAAGCTAGTCTAGTGGTAGTATTAAGCTAGTCTCCGCCTATCTGCGTCTTAAGCTAGTAGAGGTTCGTCTCCTATCCGCCTCTAAGCTAGTTATAAACCTCAAGAGTCTGAATGGATATACTTATATCTCTACTCACTTGGCCGGCACCCCGATGGATGGTCCGTCCAAGAACTTTTTTGTCCCAATTCTAACTCAGGTTCATAAGCGACTCTTGGTGGAACCCTACTACGCTACTACGACTACGATATCGTCCTGTACAGGACTACTACGATACGATACTTCGGGCGACGGACTGCTACTACGAGCTACTACGACGAGGATTTTGGAAGTATCTTCCGTAACTACTAGACCATCACTTGAGCTCGCGCCCCTGATCTACTACGAAATTACTCTACTACGACGAGGGGTCTACTACGACCTACTACGAACAATCGTAGACACAGAGTTGACGCAAGACCCCCCGGCTACTACGAGCTACTACGATACGAGCAGGCTCATTCACTGGGAGGCGGTTAACATGCCATCGTATACTACTACGAGGAAAACCCGTTGCTACTACTACGAGGTCAGAGTTGCTACTACGAGTTTATTGCACAGCAGATGAGGTCTACTACGAAGAACGCCCTACTACGAGACAGCTACTACGACTACTACGATGGCTTGATTACTGCGAAGATGGCCAGCTAGGTGACTGGCGCATATAGACCACGACGGCTACTACGATACGACCATGGTGACGAGGTTACCCTACTACGAACACTCTACCTACTACGATCGGGCTCTACTACCTACTACTACTACGAAAGAGTAACAGTCCGTAAGATAGGTCACCATTGGGGCCGCCTCCGAGTGTGGAAAGCCCGGTGAGAACGATCTAACCGTACACGATTAGTGTTTCTCGTAGCCTTTAAACGAAATACGAGGCACCGTCGGCGCTCGAACAGACGGTCTTGCTGTGCCCGGCCATCTCACTAGCAGTACAGGGTAGTCTGTGCCAAAGCATGACCCTACGACCCGAAGATATCCCGCTCAACTGTCTAAAAATTCCAATGAGACTGACTCACTAGCTACTCTTGGAACGACCACTCGTGCATAGGTTCTCTCGTCCTTCTATATAACAGTATGTCGGCGGCCCTATCTTTGCATGAGCGTGCAGCCGTATGCTACAGTGTGCAGTAAGAACTATTAGGGAAGCCTCAGCCCCCCTAACACCGCGCTGTGCTTATACGATGAAAGGCTCTACACAAACACCGTACAGTCTGTGCAGTCCCACGTGCACTTTTGTTCATTGTATGGCTGGTCTACTTTTCAATGACATGGATAATCCACGGGTGCATTAGTAACAGACATCGTCGGCATTGCCCAGTCTGTTCCACCGTTGTCGGAGTGCCCTCATGAGTGTTCTGAACAAAAGAATGTGAGTATCTTGTAACGGATCAGAGTGCAAGGTGTCATTGGCCCCTGGTGGGCCCCTGGTCCCGTAGAACCCAACGTGACGCCCCTGGTCTGGTACAAGCGTAAGACTTAGGCCCCGCCCCTGGTCGCTACGCCCCTGGTACTCCATGCGCCCCTGGTTGCCCCTGGTGCAAGCAAGTTACGACATCACGGCCGACCGCTGGAGCCTCGAACGAGAGCCCCTGGTCTTCATGCCCCTGGTGGCCCCTGGTAAGAGAGCCCCGCCCCTGGTGTGGGTTAATATCACGATTGCTGAGCTGACGCCCAGGTTTGGTAAGGCCCCTGGTTTTGATGCGCCGCCCCTGGTGCGATGAGCTCCATTACTCCGGACGCGCCCCTGGTGTGAGCTATAGTTAGGACTGCTACGCGCCCCTGGTAACGACGTATGCGGCCCCTGGTCCAGGGGCTAGCCCCTGGTCCTGGTTAGTAGTACGGCCCGACGATACCTTGCCGCCCCTGGTCCTGGTCTACCGCAACTCACCGGTTGGCTAGGTTGTATGACGACTGAGTTGTAAGCCCCTGGTGAAATCGCCCCTGGTCTTATAAAGCCCGCCCCTGGTGGTGCCCCTGGTCCCTGGTTTGAGCCCCTGGTACAGCAAGTGATTGCGTAAGTCTGATTGACAAAACGATTGAGGGCTCGTACTATTCCATTCGGTTACGCGCTCGCCCATACCACCGCTCGTAGTACGCGGTATTGATCATCCCCCGCATTTTGCGTATCGGCTCCGATAGTAATGACCCGGAACGCTCAATTGGTCAGGGGCCGCCCCGTTAATCGCATATGATTGGTCACTGGAGCCATCAGCCCTGGGGGTGGCAAGCTAAAGAGCACCACAGCCCCATTCGGCGAGCCGGCTCGACTTACGTATCACCATAATGGAGCAGCAAGGCAGTTTGGTAAAGACCAGATGAAGGAAGGGTCGCGCCCGTCGCATCGACCGTGCTTATATCGCACGTGGACGCCTCACTCACCAGGACATATTGCGACATGATTACCAAATTGCACCGGGATAATCGTCTGACCCGCAGGGAGCAGGTTTGAGCTTCGGCTCTTATTTAGTACTTGAGGGAGCAGGCAGAGGGAGCAGAAGGGAGCAGGAAGAAGTACTTGCAGTCTGGTATTCCATCACTATGGATAAGGGAAGGGAGCAGGAGGGAGCAGCCAAAGGGAGCAAGGGAGCAGCCCGGTTGATAGCGTCTCTTAAGAGGGAGCAGGACAGTAGGGAGGATGGCGGAACCCGGATTTAGTTAGGAGGATGGCGGTGCAGGATGGCGGGCAGGGAGCAGGGATGGCGGTGAGAGGGAGCAGAACTGGTGATTCACCTGTGATTCACGGTGATTCACGGCGGATGGCGTGATTCACAGCAGGGTTAAGGTAGGGATGGTGATTCACGATGTGATTCACAGGGAGCAGGCTCCGGGCGGGTGATTCACGGGGTGATTCAGTGATTCACGGGGAGTGATTCACGGGAGCAGGGATGGCGGGGGGTGATTCACCACGGGCCGTTGTGAGTGATTCACGGATGTGATTCACAGTGATTCACATGGCGGGTTGTTGTGATTCACGATTCACAAGGGAGCAGAGGGAAAGTGATTCACACGCCGTTCGGGTTCCCAACTGGGAGGATGGCGGTTAAGGATGGTGATTCACGGGTTCGGGTGATTGTGATGTGATTCACGAGGATGGCGGGCGGTGACGACGTGATTCACGAAGTGATTCACATGGCGGGCCGGATGGCGTGATTCACTGATTCACGGACTATGGTGATTCACGATGGGTGATTCACCGTTTGTAAATCCGCGGGCCGTTGTTTTATACCGGGCGTGATTCACACTGTGATTCACTCGGGCCGTTCGGGCCGTTGTGATTCACCGGGCCGTTCGGGCCGTT"
kmer_clumps(pf_genome["Pf3D7_10_v3"], 9, 516, 19)
In [ ]:
def concatenate_bases(list_of_bases):
return ''.join(list_of_bases)
In [388]:
def occurrences(string, sub):
""" Counts overlapping string occurrences """
count = start = 0
positions = list()
while True:
start = string.find(sub, start) + 1
if start > 0:
count += 1
positions.append(start - 1)
else:
return [sub, count, positions]
In [420]:
def doesClump(positions, L, t):
""" Return True or False whether there are clumps found within a list of start positions"""
differences = list()
for i in range(len(positions) - 1):
possible_clump = positions[i:i+L]
for j in range(len(possible_clump) - 1):
first = possible_clump[j]
second = possible_clump[j+1]
differences.append(first - second)
if sum(differences) <= L:
return True
return False
In [431]:
def kmer_clumps(genome, k, L, t):
""" Find patterns forming clumps in a string """
clumps = list()
kmers = [''.join(bases) for bases in list(itertools.product("ACTG", repeat=k))] # slightly faster implementation than above
occ = [occurrences(genome, kmer) for kmer in kmers] # slightly faster implementation than above
hocc = [[kmer,occurences,positions] for kmer,occurences,positions in occ if occurences >= t]
#cocc = [[kmer,occurences,positions] for kmer,occurences,positions in hocc if doesClump(positions, L, t)]
return hocc
In [ ]:
%%timeit
s = "CCAAACGAGGCATTGGCGGGGGATTGAAATTCTTGATGGCTGAGCACTGACTGAGCACTGGAGGATCTGAGCACTGCTGAGCACTGAGGCTCGATGGCCATAAAAAACCCTGATGGGTGGATCTGAGCATAAAAAAACTCCCGGGCATAAAAAATCATAAAAAAGCACTGCATAAAAAAACTGCATAAAAAACGTAGTCCTGCAGATCAGATGGGTGGCCATAAAAAACATAAAAAACACTGGTAGATGGGTGCATAAAAAACATAAAAAAGAGCACTGGTGGGCATAAAAAACTGCATAAAAAAAGACGCTACACATAAAAAAGGGCATAAAAAACCTGAGCACTCTTCTGAGCACTATGGGTGGGCTCATAAAAAAAACCATAAAAAACATAAAAAAATGGGTCTGACTGAGCACTCACTCAGATGGGTGCTGCATAAAAAACATAACATAAAAAAAGCACTAAGCTCTGGATGGGTGGGACTGAGCACTCATAAAAAAACCTGAGCATAAAAAATGAGCACTACGTTCATAAAAAAGATGGGTGGGGCTGAGCATAAAAAAAAAAACATAAAAAATGGGTGATGGGTGGGGTCTTCAATAACATAAAAAATAAAAAAATGCGCCGGTCCATAAAAAACATAAAAAAAACATAAAAAAATAGGTCTTGTCTTCAACATAAAAAAGCAAACTTGGTCTTCAATCATGACGTATGGTCAAGGGCTTGGATAAGTCTTCAATGTCTTCAATAATGAGCAGGCTTCGTCTTCAATAATTCAATCCTGTTCATCGTCTTCAATAAATTGGAGGTTAGCATGGGAAAGGTCTTCAATCTTCAATGGGGACGGTCTTCAATTTTTGAGGCTGATAACGATAGTCTCGGGTGTCTTCAATGTCTTCAATTCTTCGATTTGTCTTCAGTCTTGTCTTCAATGATTTCCAGGGAGTGATCTGGTGACGCTTTCTCCGGGTCTGTCTTCAATCGTCTTCAATGTCTTCAATCACGGTCTTCAATTATGCGGGGGCCGGCTCCACGGTGTTTATTCGAGTTTACACCTGGGAGTTTAGAACGCCACGAGTCGTCTTCAATTATCTCCATTAGTAGTCTTCAATCTGCAATCCAGTCTTCAAGTCTTCAATAATTTCGGATGCAGTCTTCAATGCGTTGCGCACTTAACGGCAGTTCCCCATTTTTCGCGTAATCCGGCATGACGCTGGACCGTTGGTTACGGGGCTCGTTGGAAGGCCCGTGGCTGGCTAGGCATTGGGATCATGTAATGTTATATCCTTCGGCTCGCGTATGCATCCTTGCATCTTGCATACTGCATACCCTCTTGCATACCTTGCATACACGGCCCTCACCACTTGAGACCGCCGCAACGTGCGACTTGCATACCTGCTCCCAAGGTGTGATTTGTTGTTACATGTGATCCTTGCATACTTATCCTTGCATACTACGTTTCAACGAGGCTCTTGCATACTGAGTTGGCTGGTCCCTCTTGCATACTACCCTCGCCCCAGTAGGTGGTGTAAACCTGCCTCTGTGTTCGAGCTTGCATACAGTCCCACGGCTTGCATACCACTTGCATACTTGCTTGCATACAAAGTCTGACTTGCATACTCACCACCGCTTGCATACCCGATCAATTCCCTGCGGCCTTGCATACATGGCCGTGATTATTGCCGCTAGCGCCTTTACCATGGACACCACCGGCACCACAAGAGAGGCCTCTTGCATACGCCCGGGCTGTCTTGCATACTGAATGCGTGTCAAGTTATTCTCTCTTGGTCCTTGTCAGCAAACTTGCATACCAGCAGGGGGAAGCTTGAAGGCTGCTTGCGTCCTTGTCGTAGACCTGTCCTTGTCTATTGTGGACCTTATCTTGGTCCTTGTCGTCATACAGAGTGTGACCAATATGTTCCCCCGTGAGATCTCGTTGGCGTCCTTGTCCCGCTTTCGAAACGCGGTTCCTGGCTTATCGTCCTTGTCTTGTCCTTGTCGTCCTTGTCGTCCTTGTCGTCGCGGTCCTTGTCCCTTTGTTCTTGTCCTTGTCTGTCCTTGTGGTCCGTCCTTGTCCGAAGATCAGTCCGTCCTTGTCTCAGGCGGCGTGTACTTAGGGCAAGTCCTTGTCAGAGATCAGGGAAGATCAGAAGATCAGTGTCCTTGTCGTCCACGGTCCTTGTCATCAGGGTGAAGATCAGGAGTAGAAGATGGTCGTCCTTGTCGAAGATCGTCCGTCCTTGTCTCTGTCCTTGTCATAGCTGAAGATCAGGTCCTTGTCGGGAAGATGAAGAGTCCTTGTCGAAGATCAGGACCGAAAACCGAAAACCAACGAAGATCAGGAAAAGAAAACCAACGAAAACCAATTAGAGAAGATCAGGAAGATCAGCGCTTGGGCATAATGAAGATCAGAGTCAGATGAAGATCAGCAGTGGAAAACCAGAAAACCAAACCCTACCTCAGGATGAAGATCAGAAACCAAAAAAACCAATGAAAACCAAAAATATAGTCGAAGATCAGAAACCAAAACCAAACAAAGAAGATCAGCCGCCGAAGATCAGGAAGATCAGGTTATAGTTGTGAAAGGTTTAATGAAAACCAAAATCGTGAAGAAAACCAAAAAACCAACCAAGCGAATGTATTCGCTATCGTGACTGGAAAACCAAAGCCACTTAATATCGATGGGGCTTGACGAAAACCAAAGGAAAACCAAGTGGGAAAACCAACGACGCCTAGCTACCAGAAAACCAATACGCACAGCCCCTGGGACCACAAGAAGAAACTTACAGCGGAAAACCAAAAACCAACGGATATTCTAGCTGTCAGTTACATTTTGGAAGTTCCTTCAGAAAACCAAAGTAAGAAGCACATCTACTACCGCGCTAACATTCTTGCTGAATATAGAGTCGTTGTTTGGATTACCTCCAGTACTACTGCGTTCTTTGGATTAAAATTTGGATTACTGGAACACAAACATTTGGATTAATTAACCCTGATCTCTGGCGGTAAACGGTTTGGATTATTGTTTGGATTACAGTTATTCCGGGGATTAGATATACTGCCAGCTATTTTGGATTATTATGCTATCTTTTGTTTGGATTATTATCCTAGAAACTTTGGATTTTTGGATTAAATACCGAAATGCTTGAGACGTGTGGATTGTTTAACCAAGCATTTGGATTATACATTTGGATTAATTTTTGGATTATTGGATTAGATTTATTCCGGTCGCTTCTCGCTTTTTTGGATTATAGCAGTTATTTTGGATTACACCGCCCAGAATAACGAGCACTTGGCTTAGCTAGCTTTGGATTAGATTATGTCCTTTGGATTAGCATTCACACCATCGCGATTGGAAGGCTCAATTTTGGATTAAACCATTGACAATGGAGCCCACAGCACGTTTGGATTAGTGGGTCACTTTGGATTATTTGGATTATTTTTGGATTATATTTTGGATTTTGGATTATTATTGCTCGGGATTTCTAACTATGAACCAATTCTAAACAACTAACTATGCTAACTATGATGTTTTGCGCGTTAATCTCCCTAACTATGGACGGGAGCGCTTGCCGGTCGACTAACTATGAGCGTCAAGTGGTCGAAAGGGCCTAACCGCCTAACTATGGCTAACTATGCGACCTAGTAGCATGAAAACAACAACTATGCCTAACTATGACTAACTATGACTAACTATGGTGTTACACAAGTATCATTAGCATAAGCCACCTAACTATGCAATGTCCGGGGTAGTTACATAGTCGTGGACTACATTCTAACTATGACTGGTGCCTAACTATGTAGTCCTAACTATGCTACTAACTATGTATGTCCTAACTATGTGCCATGCCCAAGCTAACTATGCCTAACTATGCCTAACTATGTGGACGGCATACGTATTGCGTATAAACGCAATATGTATTGCTAAACGCAATTGTGCACGTATAAACTAACTATGTCGAAACCCCACTAACTATGTAACCTAACTATGCAATTATCCTGCTAACTATGCTAACTATGAAACGCAAATTGCGTGGAGGTCTCTAACTAACTATGGCAAGTATAACTAACTATGCGTAAACGCAAGCAAAGCAATGCGTTGGTATGCTAAACGCAATGTATTGCGTATGCGGCAGTACCGTTAAACGCAATATTGCGTGACGATAGTCCATAAACGCAATCTGTCCCGGAAGTTCCGTCACCTTAAACGCAATGTAAACGCAACCATGCTTTGTATTGCGTTAAACGCAACGCAATTAAACGCAAGCGTATTGCGTAGTTTGGTATTGCGTGTATTGCGTGGATCCGTGGAATAAACGCAATTATTGCGTTGGTTTCCTTGCTCCGGTGTTAAACGCAAGCCTCCCGCAGTATTGCGTCAAGTTAAATAAACGCAATAATCTCCCGATCTTAAATAAACGCAAACTCACGCAGGTTTTTTAAACGCAAGCAATTGCGTTTCACTTAAACGCAAGCAATAATGCGCACCCAGCATTAAAGCCTATGGACGCTCCCTTCATATTATAGTCTTATGTGTGCAACCGGTTGCCAGACCTATAAAATCATGACAGAAATTGGGAAACAGTCCAATGCTAATCATCTGTTCAGGTGGCTGGACACAGTCCAATGTGTCAATGTACGGACGTCACATTCGCTAAGGGCTATGGTATTATTGAGAAGACTTCACAAGCTTTTAACGATAAGCCGGCTCGGAGTCTGCTTCAAAAATCCGAGCCACCCATCCACAGCTGTGGTTGTCAATCGTCTGTCACTACAAGGTTGCCCATTCCTGAATGTTAAGCTAAAGAATCGAGGGACGACAATATCGTGCGCCTCTAACCTTAGACTCCATCGTGTCGACTGTGATTTACCGCACCTCTCCGGCCTCGTTAATCGTGATAGTAGTACGCGGTCAATTGAATCCAAGTAATCTTGATTTGGAACAAGGTAATGACACTACACATTACGGAGACAGAGCCCACCGAGTCATGAGAGTATTTTAACTTTGCAAGGGCCTCGATCTGATGCGGATTACTCCGACATGCCTATGCTGATGTACCTCATGGTCTCCTCCCACGATAGTCGTGAGACCCTACAGAGGCCGCGTCCCCCTTATTTCCTGAGTATCCGCACCCCTAGGAATTACGTGTAAGACGTGATACCACAGATCGGTACTCCGACGGCCTCGGGGAACCAGGCGGTTTATAGTTTAGTCATGGAACTCATGTAAATCGAATTGCAGGAGCCTACCCATCGGTGCTGATCGTCTTGGTGAAATACCCTATAAAGATACTGGCGCTACCTCACCTGTACCTTTTCGTTTGCGCCGTTAAATCGGAAATGGGGGTACCATGTACCCTCTAAATCCGCCTGGCATCCGCCAAGGTATAAAGTGATTGCTGCGTGTGAAGAGGATCTAGTCGATTTTCGCAGTGGCGAGCTACGTAAACGTTCTCACCTGCCTGAGAGTTAATGAGTAACAGATATCGTATTAGTGTGCCACTCATGCGCTCTACAACCCTAAACTCAACTGGCCTTACGGCCGAGCCTATGCGAGTAATGAGTTCGCTCCAAAGGAAGACACCCACAAGCTGTTGGATAGTGGCCCCTCGGACTGTTCGCCGCATAAAGGGTGATGCAACAACCTCAACGTAGGAAATTCCTGACGGTCTCAATCTACGAGTATTTTTCTTACCCGGCGCGCAGGGGCTCAATCGGATCCTGTGGGCACCCGACCTTGCTACTCGGAACTGACCGAGAGAACTAACGAAATTTCGTGATCGTGATGACCGAGACGTCTTGTCTTTATGCATGACCGAGAGACTGACCGAGATAGGCCCTACACTGACCGAGACCCGGGCGTGTCTCACTGGCGAATTACGTAGAGCGAGTTCGTGACCGAGATAGTCAATGATGACCGAGACTAGTGATTAAGCTTTGACCGAGACCCATTTTGTAAGCTAGTACTGAACTTAAGCTAGTTTTCTGACCGAGATGACCGAGAAAGTAATGACCGAGACTAGTTCGTTGACCGAGAGACCGAGATCTGTGACCGAGAAGACTGACCGAGATGTAAGCTAGTTATATGACCGAGATATGACCGAGACGCAAAATGACCGAGAAGTTGACCGAGATCAGGTTTGATGACCGAGAAAGTCCGAACCCGTGGATTAAGCTAGTGTAATAATATGACCGTGACCGAGAGTGACCGAGAGTGCTAAGCTAGTGACCGAGATAGTAAGCTAGTGATTAAGCTATGACCGAGAGAAGATCGATTTAGCCAACTCCACTGACCGAGACGAGAAACGCTGCTATCCCGTTGACCGAGAACTTACAAAGGGTTTCATGTGTTCTCATAAGCTTAAGCTAGTCTAGTGGTAGTATTAAGCTAGTCTCCGCCTATCTGCGTCTTAAGCTAGTAGAGGTTCGTCTCCTATCCGCCTCTAAGCTAGTTATAAACCTCAAGAGTCTGAATGGATATACTTATATCTCTACTCACTTGGCCGGCACCCCGATGGATGGTCCGTCCAAGAACTTTTTTGTCCCAATTCTAACTCAGGTTCATAAGCGACTCTTGGTGGAACCCTACTACGCTACTACGACTACGATATCGTCCTGTACAGGACTACTACGATACGATACTTCGGGCGACGGACTGCTACTACGAGCTACTACGACGAGGATTTTGGAAGTATCTTCCGTAACTACTAGACCATCACTTGAGCTCGCGCCCCTGATCTACTACGAAATTACTCTACTACGACGAGGGGTCTACTACGACCTACTACGAACAATCGTAGACACAGAGTTGACGCAAGACCCCCCGGCTACTACGAGCTACTACGATACGAGCAGGCTCATTCACTGGGAGGCGGTTAACATGCCATCGTATACTACTACGAGGAAAACCCGTTGCTACTACTACGAGGTCAGAGTTGCTACTACGAGTTTATTGCACAGCAGATGAGGTCTACTACGAAGAACGCCCTACTACGAGACAGCTACTACGACTACTACGATGGCTTGATTACTGCGAAGATGGCCAGCTAGGTGACTGGCGCATATAGACCACGACGGCTACTACGATACGACCATGGTGACGAGGTTACCCTACTACGAACACTCTACCTACTACGATCGGGCTCTACTACCTACTACTACTACGAAAGAGTAACAGTCCGTAAGATAGGTCACCATTGGGGCCGCCTCCGAGTGTGGAAAGCCCGGTGAGAACGATCTAACCGTACACGATTAGTGTTTCTCGTAGCCTTTAAACGAAATACGAGGCACCGTCGGCGCTCGAACAGACGGTCTTGCTGTGCCCGGCCATCTCACTAGCAGTACAGGGTAGTCTGTGCCAAAGCATGACCCTACGACCCGAAGATATCCCGCTCAACTGTCTAAAAATTCCAATGAGACTGACTCACTAGCTACTCTTGGAACGACCACTCGTGCATAGGTTCTCTCGTCCTTCTATATAACAGTATGTCGGCGGCCCTATCTTTGCATGAGCGTGCAGCCGTATGCTACAGTGTGCAGTAAGAACTATTAGGGAAGCCTCAGCCCCCCTAACACCGCGCTGTGCTTATACGATGAAAGGCTCTACACAAACACCGTACAGTCTGTGCAGTCCCACGTGCACTTTTGTTCATTGTATGGCTGGTCTACTTTTCAATGACATGGATAATCCACGGGTGCATTAGTAACAGACATCGTCGGCATTGCCCAGTCTGTTCCACCGTTGTCGGAGTGCCCTCATGAGTGTTCTGAACAAAAGAATGTGAGTATCTTGTAACGGATCAGAGTGCAAGGTGTCATTGGCCCCTGGTGGGCCCCTGGTCCCGTAGAACCCAACGTGACGCCCCTGGTCTGGTACAAGCGTAAGACTTAGGCCCCGCCCCTGGTCGCTACGCCCCTGGTACTCCATGCGCCCCTGGTTGCCCCTGGTGCAAGCAAGTTACGACATCACGGCCGACCGCTGGAGCCTCGAACGAGAGCCCCTGGTCTTCATGCCCCTGGTGGCCCCTGGTAAGAGAGCCCCGCCCCTGGTGTGGGTTAATATCACGATTGCTGAGCTGACGCCCAGGTTTGGTAAGGCCCCTGGTTTTGATGCGCCGCCCCTGGTGCGATGAGCTCCATTACTCCGGACGCGCCCCTGGTGTGAGCTATAGTTAGGACTGCTACGCGCCCCTGGTAACGACGTATGCGGCCCCTGGTCCAGGGGCTAGCCCCTGGTCCTGGTTAGTAGTACGGCCCGACGATACCTTGCCGCCCCTGGTCCTGGTCTACCGCAACTCACCGGTTGGCTAGGTTGTATGACGACTGAGTTGTAAGCCCCTGGTGAAATCGCCCCTGGTCTTATAAAGCCCGCCCCTGGTGGTGCCCCTGGTCCCTGGTTTGAGCCCCTGGTACAGCAAGTGATTGCGTAAGTCTGATTGACAAAACGATTGAGGGCTCGTACTATTCCATTCGGTTACGCGCTCGCCCATACCACCGCTCGTAGTACGCGGTATTGATCATCCCCCGCATTTTGCGTATCGGCTCCGATAGTAATGACCCGGAACGCTCAATTGGTCAGGGGCCGCCCCGTTAATCGCATATGATTGGTCACTGGAGCCATCAGCCCTGGGGGTGGCAAGCTAAAGAGCACCACAGCCCCATTCGGCGAGCCGGCTCGACTTACGTATCACCATAATGGAGCAGCAAGGCAGTTTGGTAAAGACCAGATGAAGGAAGGGTCGCGCCCGTCGCATCGACCGTGCTTATATCGCACGTGGACGCCTCACTCACCAGGACATATTGCGACATGATTACCAAATTGCACCGGGATAATCGTCTGACCCGCAGGGAGCAGGTTTGAGCTTCGGCTCTTATTTAGTACTTGAGGGAGCAGGCAGAGGGAGCAGAAGGGAGCAGGAAGAAGTACTTGCAGTCTGGTATTCCATCACTATGGATAAGGGAAGGGAGCAGGAGGGAGCAGCCAAAGGGAGCAAGGGAGCAGCCCGGTTGATAGCGTCTCTTAAGAGGGAGCAGGACAGTAGGGAGGATGGCGGAACCCGGATTTAGTTAGGAGGATGGCGGTGCAGGATGGCGGGCAGGGAGCAGGGATGGCGGTGAGAGGGAGCAGAACTGGTGATTCACCTGTGATTCACGGTGATTCACGGCGGATGGCGTGATTCACAGCAGGGTTAAGGTAGGGATGGTGATTCACGATGTGATTCACAGGGAGCAGGCTCCGGGCGGGTGATTCACGGGGTGATTCAGTGATTCACGGGGAGTGATTCACGGGAGCAGGGATGGCGGGGGGTGATTCACCACGGGCCGTTGTGAGTGATTCACGGATGTGATTCACAGTGATTCACATGGCGGGTTGTTGTGATTCACGATTCACAAGGGAGCAGAGGGAAAGTGATTCACACGCCGTTCGGGTTCCCAACTGGGAGGATGGCGGTTAAGGATGGTGATTCACGGGTTCGGGTGATTGTGATGTGATTCACGAGGATGGCGGGCGGTGACGACGTGATTCACGAAGTGATTCACATGGCGGGCCGGATGGCGTGATTCACTGATTCACGGACTATGGTGATTCACGATGGGTGATTCACCGTTTGTAAATCCGCGGGCCGTTGTTTTATACCGGGCGTGATTCACACTGTGATTCACTCGGGCCGTTCGGGCCGTTGTGATTCACCGGGCCGTTCGGGCCGTT"
kmer_clumps(s, 9, 516, 19)
In [432]:
%%timeit
s = "CCAAACGAGGCATTGGCGGGGGATTGAAATTCTTGATGGCTGAGCACTGACTGAGCACTGGAGGATCTGAGCACTGCTGAGCACTGAGGCTCGATGGCCATAAAAAACCCTGATGGGTGGATCTGAGCATAAAAAAACTCCCGGGCATAAAAAATCATAAAAAAGCACTGCATAAAAAAACTGCATAAAAAACGTAGTCCTGCAGATCAGATGGGTGGCCATAAAAAACATAAAAAACACTGGTAGATGGGTGCATAAAAAACATAAAAAAGAGCACTGGTGGGCATAAAAAACTGCATAAAAAAAGACGCTACACATAAAAAAGGGCATAAAAAACCTGAGCACTCTTCTGAGCACTATGGGTGGGCTCATAAAAAAAACCATAAAAAACATAAAAAAATGGGTCTGACTGAGCACTCACTCAGATGGGTGCTGCATAAAAAACATAACATAAAAAAAGCACTAAGCTCTGGATGGGTGGGACTGAGCACTCATAAAAAAACCTGAGCATAAAAAATGAGCACTACGTTCATAAAAAAGATGGGTGGGGCTGAGCATAAAAAAAAAAACATAAAAAATGGGTGATGGGTGGGGTCTTCAATAACATAAAAAATAAAAAAATGCGCCGGTCCATAAAAAACATAAAAAAAACATAAAAAAATAGGTCTTGTCTTCAACATAAAAAAGCAAACTTGGTCTTCAATCATGACGTATGGTCAAGGGCTTGGATAAGTCTTCAATGTCTTCAATAATGAGCAGGCTTCGTCTTCAATAATTCAATCCTGTTCATCGTCTTCAATAAATTGGAGGTTAGCATGGGAAAGGTCTTCAATCTTCAATGGGGACGGTCTTCAATTTTTGAGGCTGATAACGATAGTCTCGGGTGTCTTCAATGTCTTCAATTCTTCGATTTGTCTTCAGTCTTGTCTTCAATGATTTCCAGGGAGTGATCTGGTGACGCTTTCTCCGGGTCTGTCTTCAATCGTCTTCAATGTCTTCAATCACGGTCTTCAATTATGCGGGGGCCGGCTCCACGGTGTTTATTCGAGTTTACACCTGGGAGTTTAGAACGCCACGAGTCGTCTTCAATTATCTCCATTAGTAGTCTTCAATCTGCAATCCAGTCTTCAAGTCTTCAATAATTTCGGATGCAGTCTTCAATGCGTTGCGCACTTAACGGCAGTTCCCCATTTTTCGCGTAATCCGGCATGACGCTGGACCGTTGGTTACGGGGCTCGTTGGAAGGCCCGTGGCTGGCTAGGCATTGGGATCATGTAATGTTATATCCTTCGGCTCGCGTATGCATCCTTGCATCTTGCATACTGCATACCCTCTTGCATACCTTGCATACACGGCCCTCACCACTTGAGACCGCCGCAACGTGCGACTTGCATACCTGCTCCCAAGGTGTGATTTGTTGTTACATGTGATCCTTGCATACTTATCCTTGCATACTACGTTTCAACGAGGCTCTTGCATACTGAGTTGGCTGGTCCCTCTTGCATACTACCCTCGCCCCAGTAGGTGGTGTAAACCTGCCTCTGTGTTCGAGCTTGCATACAGTCCCACGGCTTGCATACCACTTGCATACTTGCTTGCATACAAAGTCTGACTTGCATACTCACCACCGCTTGCATACCCGATCAATTCCCTGCGGCCTTGCATACATGGCCGTGATTATTGCCGCTAGCGCCTTTACCATGGACACCACCGGCACCACAAGAGAGGCCTCTTGCATACGCCCGGGCTGTCTTGCATACTGAATGCGTGTCAAGTTATTCTCTCTTGGTCCTTGTCAGCAAACTTGCATACCAGCAGGGGGAAGCTTGAAGGCTGCTTGCGTCCTTGTCGTAGACCTGTCCTTGTCTATTGTGGACCTTATCTTGGTCCTTGTCGTCATACAGAGTGTGACCAATATGTTCCCCCGTGAGATCTCGTTGGCGTCCTTGTCCCGCTTTCGAAACGCGGTTCCTGGCTTATCGTCCTTGTCTTGTCCTTGTCGTCCTTGTCGTCCTTGTCGTCGCGGTCCTTGTCCCTTTGTTCTTGTCCTTGTCTGTCCTTGTGGTCCGTCCTTGTCCGAAGATCAGTCCGTCCTTGTCTCAGGCGGCGTGTACTTAGGGCAAGTCCTTGTCAGAGATCAGGGAAGATCAGAAGATCAGTGTCCTTGTCGTCCACGGTCCTTGTCATCAGGGTGAAGATCAGGAGTAGAAGATGGTCGTCCTTGTCGAAGATCGTCCGTCCTTGTCTCTGTCCTTGTCATAGCTGAAGATCAGGTCCTTGTCGGGAAGATGAAGAGTCCTTGTCGAAGATCAGGACCGAAAACCGAAAACCAACGAAGATCAGGAAAAGAAAACCAACGAAAACCAATTAGAGAAGATCAGGAAGATCAGCGCTTGGGCATAATGAAGATCAGAGTCAGATGAAGATCAGCAGTGGAAAACCAGAAAACCAAACCCTACCTCAGGATGAAGATCAGAAACCAAAAAAACCAATGAAAACCAAAAATATAGTCGAAGATCAGAAACCAAAACCAAACAAAGAAGATCAGCCGCCGAAGATCAGGAAGATCAGGTTATAGTTGTGAAAGGTTTAATGAAAACCAAAATCGTGAAGAAAACCAAAAAACCAACCAAGCGAATGTATTCGCTATCGTGACTGGAAAACCAAAGCCACTTAATATCGATGGGGCTTGACGAAAACCAAAGGAAAACCAAGTGGGAAAACCAACGACGCCTAGCTACCAGAAAACCAATACGCACAGCCCCTGGGACCACAAGAAGAAACTTACAGCGGAAAACCAAAAACCAACGGATATTCTAGCTGTCAGTTACATTTTGGAAGTTCCTTCAGAAAACCAAAGTAAGAAGCACATCTACTACCGCGCTAACATTCTTGCTGAATATAGAGTCGTTGTTTGGATTACCTCCAGTACTACTGCGTTCTTTGGATTAAAATTTGGATTACTGGAACACAAACATTTGGATTAATTAACCCTGATCTCTGGCGGTAAACGGTTTGGATTATTGTTTGGATTACAGTTATTCCGGGGATTAGATATACTGCCAGCTATTTTGGATTATTATGCTATCTTTTGTTTGGATTATTATCCTAGAAACTTTGGATTTTTGGATTAAATACCGAAATGCTTGAGACGTGTGGATTGTTTAACCAAGCATTTGGATTATACATTTGGATTAATTTTTGGATTATTGGATTAGATTTATTCCGGTCGCTTCTCGCTTTTTTGGATTATAGCAGTTATTTTGGATTACACCGCCCAGAATAACGAGCACTTGGCTTAGCTAGCTTTGGATTAGATTATGTCCTTTGGATTAGCATTCACACCATCGCGATTGGAAGGCTCAATTTTGGATTAAACCATTGACAATGGAGCCCACAGCACGTTTGGATTAGTGGGTCACTTTGGATTATTTGGATTATTTTTGGATTATATTTTGGATTTTGGATTATTATTGCTCGGGATTTCTAACTATGAACCAATTCTAAACAACTAACTATGCTAACTATGATGTTTTGCGCGTTAATCTCCCTAACTATGGACGGGAGCGCTTGCCGGTCGACTAACTATGAGCGTCAAGTGGTCGAAAGGGCCTAACCGCCTAACTATGGCTAACTATGCGACCTAGTAGCATGAAAACAACAACTATGCCTAACTATGACTAACTATGACTAACTATGGTGTTACACAAGTATCATTAGCATAAGCCACCTAACTATGCAATGTCCGGGGTAGTTACATAGTCGTGGACTACATTCTAACTATGACTGGTGCCTAACTATGTAGTCCTAACTATGCTACTAACTATGTATGTCCTAACTATGTGCCATGCCCAAGCTAACTATGCCTAACTATGCCTAACTATGTGGACGGCATACGTATTGCGTATAAACGCAATATGTATTGCTAAACGCAATTGTGCACGTATAAACTAACTATGTCGAAACCCCACTAACTATGTAACCTAACTATGCAATTATCCTGCTAACTATGCTAACTATGAAACGCAAATTGCGTGGAGGTCTCTAACTAACTATGGCAAGTATAACTAACTATGCGTAAACGCAAGCAAAGCAATGCGTTGGTATGCTAAACGCAATGTATTGCGTATGCGGCAGTACCGTTAAACGCAATATTGCGTGACGATAGTCCATAAACGCAATCTGTCCCGGAAGTTCCGTCACCTTAAACGCAATGTAAACGCAACCATGCTTTGTATTGCGTTAAACGCAACGCAATTAAACGCAAGCGTATTGCGTAGTTTGGTATTGCGTGTATTGCGTGGATCCGTGGAATAAACGCAATTATTGCGTTGGTTTCCTTGCTCCGGTGTTAAACGCAAGCCTCCCGCAGTATTGCGTCAAGTTAAATAAACGCAATAATCTCCCGATCTTAAATAAACGCAAACTCACGCAGGTTTTTTAAACGCAAGCAATTGCGTTTCACTTAAACGCAAGCAATAATGCGCACCCAGCATTAAAGCCTATGGACGCTCCCTTCATATTATAGTCTTATGTGTGCAACCGGTTGCCAGACCTATAAAATCATGACAGAAATTGGGAAACAGTCCAATGCTAATCATCTGTTCAGGTGGCTGGACACAGTCCAATGTGTCAATGTACGGACGTCACATTCGCTAAGGGCTATGGTATTATTGAGAAGACTTCACAAGCTTTTAACGATAAGCCGGCTCGGAGTCTGCTTCAAAAATCCGAGCCACCCATCCACAGCTGTGGTTGTCAATCGTCTGTCACTACAAGGTTGCCCATTCCTGAATGTTAAGCTAAAGAATCGAGGGACGACAATATCGTGCGCCTCTAACCTTAGACTCCATCGTGTCGACTGTGATTTACCGCACCTCTCCGGCCTCGTTAATCGTGATAGTAGTACGCGGTCAATTGAATCCAAGTAATCTTGATTTGGAACAAGGTAATGACACTACACATTACGGAGACAGAGCCCACCGAGTCATGAGAGTATTTTAACTTTGCAAGGGCCTCGATCTGATGCGGATTACTCCGACATGCCTATGCTGATGTACCTCATGGTCTCCTCCCACGATAGTCGTGAGACCCTACAGAGGCCGCGTCCCCCTTATTTCCTGAGTATCCGCACCCCTAGGAATTACGTGTAAGACGTGATACCACAGATCGGTACTCCGACGGCCTCGGGGAACCAGGCGGTTTATAGTTTAGTCATGGAACTCATGTAAATCGAATTGCAGGAGCCTACCCATCGGTGCTGATCGTCTTGGTGAAATACCCTATAAAGATACTGGCGCTACCTCACCTGTACCTTTTCGTTTGCGCCGTTAAATCGGAAATGGGGGTACCATGTACCCTCTAAATCCGCCTGGCATCCGCCAAGGTATAAAGTGATTGCTGCGTGTGAAGAGGATCTAGTCGATTTTCGCAGTGGCGAGCTACGTAAACGTTCTCACCTGCCTGAGAGTTAATGAGTAACAGATATCGTATTAGTGTGCCACTCATGCGCTCTACAACCCTAAACTCAACTGGCCTTACGGCCGAGCCTATGCGAGTAATGAGTTCGCTCCAAAGGAAGACACCCACAAGCTGTTGGATAGTGGCCCCTCGGACTGTTCGCCGCATAAAGGGTGATGCAACAACCTCAACGTAGGAAATTCCTGACGGTCTCAATCTACGAGTATTTTTCTTACCCGGCGCGCAGGGGCTCAATCGGATCCTGTGGGCACCCGACCTTGCTACTCGGAACTGACCGAGAGAACTAACGAAATTTCGTGATCGTGATGACCGAGACGTCTTGTCTTTATGCATGACCGAGAGACTGACCGAGATAGGCCCTACACTGACCGAGACCCGGGCGTGTCTCACTGGCGAATTACGTAGAGCGAGTTCGTGACCGAGATAGTCAATGATGACCGAGACTAGTGATTAAGCTTTGACCGAGACCCATTTTGTAAGCTAGTACTGAACTTAAGCTAGTTTTCTGACCGAGATGACCGAGAAAGTAATGACCGAGACTAGTTCGTTGACCGAGAGACCGAGATCTGTGACCGAGAAGACTGACCGAGATGTAAGCTAGTTATATGACCGAGATATGACCGAGACGCAAAATGACCGAGAAGTTGACCGAGATCAGGTTTGATGACCGAGAAAGTCCGAACCCGTGGATTAAGCTAGTGTAATAATATGACCGTGACCGAGAGTGACCGAGAGTGCTAAGCTAGTGACCGAGATAGTAAGCTAGTGATTAAGCTATGACCGAGAGAAGATCGATTTAGCCAACTCCACTGACCGAGACGAGAAACGCTGCTATCCCGTTGACCGAGAACTTACAAAGGGTTTCATGTGTTCTCATAAGCTTAAGCTAGTCTAGTGGTAGTATTAAGCTAGTCTCCGCCTATCTGCGTCTTAAGCTAGTAGAGGTTCGTCTCCTATCCGCCTCTAAGCTAGTTATAAACCTCAAGAGTCTGAATGGATATACTTATATCTCTACTCACTTGGCCGGCACCCCGATGGATGGTCCGTCCAAGAACTTTTTTGTCCCAATTCTAACTCAGGTTCATAAGCGACTCTTGGTGGAACCCTACTACGCTACTACGACTACGATATCGTCCTGTACAGGACTACTACGATACGATACTTCGGGCGACGGACTGCTACTACGAGCTACTACGACGAGGATTTTGGAAGTATCTTCCGTAACTACTAGACCATCACTTGAGCTCGCGCCCCTGATCTACTACGAAATTACTCTACTACGACGAGGGGTCTACTACGACCTACTACGAACAATCGTAGACACAGAGTTGACGCAAGACCCCCCGGCTACTACGAGCTACTACGATACGAGCAGGCTCATTCACTGGGAGGCGGTTAACATGCCATCGTATACTACTACGAGGAAAACCCGTTGCTACTACTACGAGGTCAGAGTTGCTACTACGAGTTTATTGCACAGCAGATGAGGTCTACTACGAAGAACGCCCTACTACGAGACAGCTACTACGACTACTACGATGGCTTGATTACTGCGAAGATGGCCAGCTAGGTGACTGGCGCATATAGACCACGACGGCTACTACGATACGACCATGGTGACGAGGTTACCCTACTACGAACACTCTACCTACTACGATCGGGCTCTACTACCTACTACTACTACGAAAGAGTAACAGTCCGTAAGATAGGTCACCATTGGGGCCGCCTCCGAGTGTGGAAAGCCCGGTGAGAACGATCTAACCGTACACGATTAGTGTTTCTCGTAGCCTTTAAACGAAATACGAGGCACCGTCGGCGCTCGAACAGACGGTCTTGCTGTGCCCGGCCATCTCACTAGCAGTACAGGGTAGTCTGTGCCAAAGCATGACCCTACGACCCGAAGATATCCCGCTCAACTGTCTAAAAATTCCAATGAGACTGACTCACTAGCTACTCTTGGAACGACCACTCGTGCATAGGTTCTCTCGTCCTTCTATATAACAGTATGTCGGCGGCCCTATCTTTGCATGAGCGTGCAGCCGTATGCTACAGTGTGCAGTAAGAACTATTAGGGAAGCCTCAGCCCCCCTAACACCGCGCTGTGCTTATACGATGAAAGGCTCTACACAAACACCGTACAGTCTGTGCAGTCCCACGTGCACTTTTGTTCATTGTATGGCTGGTCTACTTTTCAATGACATGGATAATCCACGGGTGCATTAGTAACAGACATCGTCGGCATTGCCCAGTCTGTTCCACCGTTGTCGGAGTGCCCTCATGAGTGTTCTGAACAAAAGAATGTGAGTATCTTGTAACGGATCAGAGTGCAAGGTGTCATTGGCCCCTGGTGGGCCCCTGGTCCCGTAGAACCCAACGTGACGCCCCTGGTCTGGTACAAGCGTAAGACTTAGGCCCCGCCCCTGGTCGCTACGCCCCTGGTACTCCATGCGCCCCTGGTTGCCCCTGGTGCAAGCAAGTTACGACATCACGGCCGACCGCTGGAGCCTCGAACGAGAGCCCCTGGTCTTCATGCCCCTGGTGGCCCCTGGTAAGAGAGCCCCGCCCCTGGTGTGGGTTAATATCACGATTGCTGAGCTGACGCCCAGGTTTGGTAAGGCCCCTGGTTTTGATGCGCCGCCCCTGGTGCGATGAGCTCCATTACTCCGGACGCGCCCCTGGTGTGAGCTATAGTTAGGACTGCTACGCGCCCCTGGTAACGACGTATGCGGCCCCTGGTCCAGGGGCTAGCCCCTGGTCCTGGTTAGTAGTACGGCCCGACGATACCTTGCCGCCCCTGGTCCTGGTCTACCGCAACTCACCGGTTGGCTAGGTTGTATGACGACTGAGTTGTAAGCCCCTGGTGAAATCGCCCCTGGTCTTATAAAGCCCGCCCCTGGTGGTGCCCCTGGTCCCTGGTTTGAGCCCCTGGTACAGCAAGTGATTGCGTAAGTCTGATTGACAAAACGATTGAGGGCTCGTACTATTCCATTCGGTTACGCGCTCGCCCATACCACCGCTCGTAGTACGCGGTATTGATCATCCCCCGCATTTTGCGTATCGGCTCCGATAGTAATGACCCGGAACGCTCAATTGGTCAGGGGCCGCCCCGTTAATCGCATATGATTGGTCACTGGAGCCATCAGCCCTGGGGGTGGCAAGCTAAAGAGCACCACAGCCCCATTCGGCGAGCCGGCTCGACTTACGTATCACCATAATGGAGCAGCAAGGCAGTTTGGTAAAGACCAGATGAAGGAAGGGTCGCGCCCGTCGCATCGACCGTGCTTATATCGCACGTGGACGCCTCACTCACCAGGACATATTGCGACATGATTACCAAATTGCACCGGGATAATCGTCTGACCCGCAGGGAGCAGGTTTGAGCTTCGGCTCTTATTTAGTACTTGAGGGAGCAGGCAGAGGGAGCAGAAGGGAGCAGGAAGAAGTACTTGCAGTCTGGTATTCCATCACTATGGATAAGGGAAGGGAGCAGGAGGGAGCAGCCAAAGGGAGCAAGGGAGCAGCCCGGTTGATAGCGTCTCTTAAGAGGGAGCAGGACAGTAGGGAGGATGGCGGAACCCGGATTTAGTTAGGAGGATGGCGGTGCAGGATGGCGGGCAGGGAGCAGGGATGGCGGTGAGAGGGAGCAGAACTGGTGATTCACCTGTGATTCACGGTGATTCACGGCGGATGGCGTGATTCACAGCAGGGTTAAGGTAGGGATGGTGATTCACGATGTGATTCACAGGGAGCAGGCTCCGGGCGGGTGATTCACGGGGTGATTCAGTGATTCACGGGGAGTGATTCACGGGAGCAGGGATGGCGGGGGGTGATTCACCACGGGCCGTTGTGAGTGATTCACGGATGTGATTCACAGTGATTCACATGGCGGGTTGTTGTGATTCACGATTCACAAGGGAGCAGAGGGAAAGTGATTCACACGCCGTTCGGGTTCCCAACTGGGAGGATGGCGGTTAAGGATGGTGATTCACGGGTTCGGGTGATTGTGATGTGATTCACGAGGATGGCGGGCGGTGACGACGTGATTCACGAAGTGATTCACATGGCGGGCCGGATGGCGTGATTCACTGATTCACGGACTATGGTGATTCACGATGGGTGATTCACCGTTTGTAAATCCGCGGGCCGTTGTTTTATACCGGGCGTGATTCACACTGTGATTCACTCGGGCCGTTCGGGCCGTTGTGATTCACCGGGCCGTTCGGGCCGTT"
kmer_clumps(pf_genome["Pf3D7_10_v3"], 9, 516, 19)
In [444]:
def minimum_skew(genome):
skew = 0
values = [0]
for nucleotide in genome:
if nucleotide == "C":
skew -= 1
elif nucleotide == "G":
skew += 1
else:
pass
values.append(skew)
minimum = min(values)
return [index for index, value in enumerate(values) if value == minimum]
In [445]:
minimum_skew("CCTATCGGTGGATTAGCATGTCCCTGTACGTTTCGCCGCGAACTAGTTCACACGGCTTGATGGCAAATGGTTTTTCCGGCGACCGTAATCGTCCACCGAG")
Out[445]:
In [445]:
s = "AGCTTTTCTCTTCACACGATGTCGCAATACCCCATCTTCTTACTTCGCGGGGTTATTATCAACGCGGGCTGCCATATCAAATTTTTTCTCGTGGTCCGTCACCAAATTCCTGCTGTTAGGTCGGTGCAATCGCCCACAATTCGTGGTATCCAGACGTGAACTTCTATTGGTGCCATATGCATTGCTGGACGCGCTAAGCCGTGCGGTCTCATCAAGTCCGCGGAACCCATCGACATACGTCTAAGTGGAACGGTCAAAACTCCGGCCCCAGGATTTGGCGGGTGAGTTCAAGGCGACCGGAATGCGCCCTCGCTTTTACACCGACACGTATCATCTATAAGAGCGAGGCTGAGAGGGGTTCGTATCCCTAACCACGGGCAGCTGCACTGCTACATACTTGGACCCGGGTATAGCGTCGCTATACCTCTACGTAGGGTTACGGTGTGATACTATGTACAATACGTCAGAGGTCCGTCGCTCTAATAGCGGGAATTTTATTGCTGACTGTAACTGACGGAGCTTTCGAATCTGCCTGACGCTGCATCTGCGTCGTTTGCCTATATCGGTAAAAATTACGGTGTGATAACTTTATATTACAGTTTCCAGTAAAGCCTTGGCTCATCCAACACAACAAGCGGGGTTGTAGGGCGAGGGGCGAATAATAATACAATGTGGAAAATGCCGATCTCCGTGTTAGCGAGCGAAAATAAGCCGCGCGGAGGGCGTGGCTGTCATGATCCGTCCTCAATAATAAAGTCATGGTTTCTATCAAGAAACGATACCCAGGCTATATGCAAGTCGCTGTTGGGCATGACGGCGCACGTAGAACGTCACTTCCAGTTCAGTCGTAGGGCGGTAACCGGTGTAGAGCCAGTTATCGAATTATGGGTGATACTGATGCAGCCTCTTGGAAATAGAATCCCCCCTTGAAACTTACCCTTGATAGTACAAAATTTTTAACGAGTTCTTTGGCTAATACCTGAGCTACTTCCGACTCGGCTTGAAGGCAAGATGGGGTTGCACATACCTCACGTGGAACCCAGCTTAGGATCATGCCAGAGGTGTCTTCAGTATACGCTTCGTTTCGGATAATGCCCTCGAGCCTTCAGCGTTGCATGCGTGGTTGAAAAGACAAATAACAGCCTCTTTCTGCAAGTAGGCAGGAAGGCCAGGCCCCTCCACTAGACTGTCTACCTATCCAAACATATGGAAAGGGCTTAGGCACCCTGATTACGGGAGGTCACTGATGGATTTTAGCTAAGATGACCGTAAGCAAAGGCACTCCCCTCGTCCGCGTTTCACGTTAGGGCTTCAACCACGATTAAAGTAACTAACTATCGAGTGTGCCGCACACGGCGAACAAGCCGCTCGTGAGGTCTAAGACCTGAGTAAGCCGACTACTTAGGGGCTCACTGACTAAGGTACTGGGCTAATGGTGTCGACCGGCTCCCTTCTCAAATCACGGAAGAGGAAGGGGAAGGGGGCGACACCTCTTAGGCTCGTTAAAAATACATAACTGCTAATACAAGGCACGAGCACTCATGGCGTCAGGATAGAGGGGGGTCTATACGGGAGACTTATCATGGACGAGGCCCCCTAAATAGGATTACTTGTAACTGTTACGGTGACATACACCAAGTGTTCTTTGTTACCATAAACCGGTCTGGCCGGGAAGATACTACCCCCCCAGCCGCATCGGATACCTAAATGAGTGGGGAGCATACTGGTTGCTCTTAAGTACATGAGCCATGATGGAAGTAAATGCTATATTTAAAGTGATCTATACAGCCCGCTGACTTGCGATCGAATGTTCCTTCCGGCCTTTACCGTCATCCTGGCTTTCACTGTGCCGGGGAACTGTCCGAGTCACGTTCTCGCTGATCAAACACCTCCTATTCCATCCGGCCTGTGTCGGCTTACTCCGGGCTAAACTGGATGACGGGGCCCCTACACGTCAAATAGAACACCTTAGCCTGCCCAGGTCGTCATTAAGCTAGAACGCGTCTCCTCTATCCACGTGTGTGTACGGTCCAATGTTCTCGTTGAGACCATTAGGTTATTGTTTATCAAGCTCGAGAAGTCTCCACTGACGACATGGAGATACTTGACTCGGACGGACGATTTTGACCGACCCCTCCGCCCATTGTGATGAAAAACATAGTGAGCACGCCCAAAGGTTTTTCAAAAGTACCGCTTATCCTGTTCTAGGGAAAAGAAGCCACGTATATGGGTGGTAGAAAGCCGTTATCAATCAAGGCCGGCTTCAAACGTCTTCAGCTCGTTGAGCATCTCGCCTCCCTGTTTATGAGTGAATTCACGGGAAGCGCTACGGTCAGTGGGACCTAAGCTGCTAGGCCACATTTCAGCACAACAACACTTTGTTCGTACCCCTAGTTGCATAGGGAATGCGGGGGAGCGATCCTTCGGACGGTGTACACTTGATCGCGAATCCTTAATCTATATTAATTCAGCATATATTACGCACCCGTCCGCTCTCTACGGCCGTTTGCACAATCTTCTGTACATGGGATCGGGATCTAGGTTGTATATATCTCTACGTATCCATAGCCACAAGCGCTGTACGTCCCTACAGCAGTAGAACAGGGTAAGAGTGGATTCAAGTTCATCCCCTCTTAAATAACATGCGGATCGTGCACTTCGTTCCGTCATAGACTCACAAAATCTGCTTACCGAGTATCGCCTTTCCTGTAAAGTAGATCTACCAATTAAGTTCCCCGAAAGCTCGTCCTAGGCCATAAGCACTCTAAGTCCGTAGCTGCTACCAGGGAGCACTTGAGGAAGTCCTTCGCTCTAACGCCGGAGTGCGGCAACGAGTATATATCGACTGTCTCCTCGAAATCGCAACAAGTCCGCATGAGCAACTACCAGTGAAACCCCTCTGCCGCTTTTTTCTTATCATAGATGCACCCATTGGTTTGGGTCGCGAAAACGTCGAAATGAATGACTTCATCTTTCCACTGAGTCTGCCCAGATCATTCAGTAAACTTGGACTGAAGGCAGAGCGTGCAGGAAATCTTCTTAGCAACTGTCATACTATGCGCGATTACACGCTACCTTCCTCGAGTGCATCCAAATGGGTATTCAGAAGACATACATCTGTTGGTCGAGCGCGATAAGAAGGACATCTAACGGTACCGAAGTGATAGATTCTGTACTTTAGGTCGATCATATCACCGATGCTGCTCGTTGGTGCAGGTACATTGGGTCCCGATCAACGAAGTCCTCACACAGCAGCGCGGATTTACAAAGCACCGTCTTTTCCATCCAATCCTCGGGTATAGGGAAGAAAGGTGGCCTGAGGAGAATCTCTCATATTGGACGGGTACACGATCCAGGCCAATGGCTATTCCGCCTAGTTTTTGAGAGCGTCGTTGGAATCACCTTGGGATCTAGTGACGGACATTCCCTGACCATGCCCCTAACGGTACCGGCCGGAGGTTATAGGTCGGGATTTTTATTGCATTCTATATTTATGACGAGCGTTTTTATACACATCGTACCCTCTTACAAAATGATAGATAGACGTTGGAGGTAGTACTGCGCGTGTGGACATCCTGCAAGAGGAGACAGCGGAAATAGCTGGATTTTCGGGCCAATGAATTGGATACCACGATTCAACCCTGTCCCTCGGGGTGCATGAATGACGTAGTTTCTAGTCCAGATCGCTATAGCTGACGGAAGCAGCAGACCAGGAGTTATACAAAGTTCTGATGATGGACCCGATGGCAGTAGGAGTGTACTGTCGAGCGCTTAACGGATCGGATCCCTTTTACTCCGCGTAGCGTGTGGCCCAGGTGTACAGGGCGTTCAATCCACGGGAGATTAGCGAATAACGTCTGCTAACAACTCGAGTGGGTAACAGGATCGCTGCGATATATAGGGCCTCGGTAGTGAGTCACCCCATGATCTAGAAATCCCAGTTGCCTATTGTTATCGACATAGTTTGCATGCTACCGGTGATTACGATAAGCATCCTTGAAGTATGTCCGGGACATAGTTGTTTACCTCCCCAGACTGTGGTTAAGCTGCTGGAACTGTAAATCAGCATACTTGCAAACTGGAATTGTAGAGGGGTGCACCCCTATTAAGAAGGGGGCTCAGAGCTGTGGCAAGACTAATGGCGGTATTCCCATAGGTAGAGGTGGAAAGATCTCAGTGTAAGTCCAGATCGTGGACGTCGCACCCTGGTTTCAACCTCATTTACCAATGGTTAGTGAAATTCGGCTCTAGTACTTCCGGGGTTAAAGAATTGCCGGGAACACAGATTTAATATTTGTCCATCCAGACCGTCCATAAGTTCATTCTCGCCCAGCCTGGCTGCCGCATCTTGGAAGAGGGGCCATCGCGCTGGTAGTAGAAAAGCTCCATGGCTTCAGGCTATATATGGAATAGACCTGTGAGGACCGCGACGTCTAGATAGAGCGATGAAGGGGATCACTGACTAGGAAGACGGAAGATCCTAGTTGTTTGTTGTTGATACGATTATTTGCATGTCAGAGATCGTGCCAAGTTCCAGCCGCAACTGATTTGAATACGCTCTGCTCACCAGCATGGTCTATCCGGGGTTTGAAGACGCGCAAATCAACGGCCATATGCTTGCCGTCAGGTGTAACCCACTTGAGGTTCGTTAAACGGCTCCGTGCAGTGCGGCCTTGCCAACCACTTGGCTTTGAGCTCTTTGATCTGAGCGTTCCCTCGCCTTGTAGTTTAGACGGGGATAAGGGTATTTGGATCGATAAGACTCGGCACCGCTAAGCCTCAGTGTGACGAAGGGGGTGGACTGGACCTTCGAGGCTACGTAGTGTCGGCCAGCGGTATTTCATTTTTAAGATTCTGGTTCGGGTATAGATAAGCCGCGTAGCGCAGACTGCCCCGAACCGTCTGGCCGGTATGCTGGGATTGATCACGTTGCGATTATGTGGAACCGACCTCGGAGGAGAGAATGTGCGATCACGGCAGGATAGGGCTAACCTCTCGCCGGGGGCACCGTAGGTTCTGCCGGCCGCGGTATTTTCACCCATAGATTCACATATTACTTCTGCGTGTTCCGTTTTCAGAGACTGGTGACAGCCGGTAAACCCATATGTTGCAGGCCCCGGTGCAGGCGGCACCGACGCTCCCGTCCTTGAAAAACGTCGGATTTGTGCACCAGTGCTAATGCGCGTATTTTTTTAAAGCACTGCGACTATCGAGGGCAGCCGCCGATAGAAACCCGTCATAAGGGTAACCCAAAGGAATGCGCTGTCTAATTGTGTGACGAGCTGGTAATTTTCCTCTCTCAAGCCCAAACTCAAGAAATGCAGGCTTGAGTCATGGCCCCCTTATGTATTAAGAAAGGATACCGAACGACTTCTCTCAAGCATAATTAGGGAACGAGATTCCCCAGTATTGAGCGTAGCTCATACCCATCGTACCTCCGGTCAAGGTGCGGCCCAGTCAGGATACGGTGGCTACCAGGCCACAGGGCGTCATACCCCCGAAGCGAAACCTCTCACATCGATGAGTTGGCTCAGCACTAACTTGTTCAATTTCATAAAGTGTCATTCGTACGGTGGATGAGCGGACGTGCCATAGACGCACGGAAATCTATAGGGATGTTCAGTCCCCTGAGCTCTTGTGCTCTCCGTGTAAACAGAGGTAATGAACCAAGGGCCACTAGCTATCTTGCCGTATCTGCTCTTTCGGAATAGCTTAACTGCGCTTTGCATTATACCTTGCTTCAATGTACTCGCTGCCGCCAGAAGGGTCCCTCCGTTAATTGAATTGCCCAGTCCTTGTTGTGCGACTTCGAGCGGCAACTAGATTCGCATATGTGTACCATACGCTATGCCGTGGTGACGAAGCGCCCTGCGAATTGTTTGAACTAGGGCACCACCCAAGTCGCGCCACCATGGAGGGTATCGTATCTCGGATATTTGGAAGAGTCGGATCCAATGTGCCTTGCCCTCCGAACGACAACTGTTCACGTAGACTCCAAACTGAGATATGAAGGACCCACACCACACCGTCCCCTTACCTAACAGCGCTCCCCGTCACCCAGACACACATCGACGCAGGACGGTCTCAGCTCGTCGTAAGCGTTGCGGCTAAGACGACCAGCGCATGCACATGCTACGAGTACGGGGAGATGTTCTTTTGATCGGTATAACGGGCTCAAGCCAGGTGCCCGAATACACCCGGTGACGTCGATGTGGAATTGGTAGGGGAGTATAACGGTTGCTGTCGCTGTCCCCGGAATCTTATAAACACCGTTATCTCGGTATTCTTCCCGAGTCACAACAACAAGACTTTCAACAGGGCTATCGCCCCTCTATAATAAGCGCTAGCCACTCGGCACCGTACGCCCACAGCGGAGTTTGGGTAGGGCGTCCCATCGTCAGGAGTCCCGTCCAACTTAATATCACTGGCGACGTTCCATGGTGGCTCGCAAAATATCCTGGGCGCCGATGATGCTGAATCCCGGCTTTTAACTTTCGCTTAACCACCAACAGTGCAGCTAGACCGGTATCCAATGACGGTTTCTTGCTTTTGTGTCCTAAAAGGAGATCGCCTTCTTTACGCCTCTGATAGGTAAACAATCATGGATGTCGCTAATAGTTCGCTTAAGACATGATTCTCTCCCAGTCCAAGCTGAATTGTACTCAATAGAATCTCTCTACTCACTAGCTTTCAAGGGGTGGCTCCAGGGTCGAACGATGATTGTGTTGTTGACAGTTTTCGGACCAAACTATTCAAGCTATCTATCTCCGTGTCCATGTGTTACCCTTTTTGTTTGGGTGTGGCCTTTTGCGTCCATGCTGACAAGTCCATCCAGGACACGAGTCTCACGACGGTTGATACCGCGAACACAACTTGTCTCCGGCGAATCTTCATGGTGTACGTAATTTAGATAGAGGCAGCTCCCTTTTCTACAGGTGCGCTGTCATAGAATAACTTAGTTGGTGAACTGAAATGGAACGATTTCGTTAACTAAAAGCAATGTATTGTAGGCGATCCTTAGGTCAAATTAACATATGCGCGAGGCCGGAGAGACGCTATTGCGCGTGAGCGGTGCACTGCGCTATGAGTCCTTCTCGATTTTTAAAGCACGCCCGTCGCGTAAAATCCCGCAGAGGATATAACGCCTTATACTCCAGCCCACGAATACCAATAGACACAGGATATATCCCGTCGCAAATTGCGCAATATCCCGACGAGTAAGATGCTTCCCTCCCAAATGCCGGAATGATGACGTGTGAAGTCACAGCCTAGATAAACGAGCTTTGGTGAATTCTGGCCGCCCTGTACCATTTCCCACACCTTCATTGGACCCTGAACCCGGGCACCTGTTGTACACCTTCCCGCACAGTGACGATACACGATGACTAAGGCACTGCTGAGTTGCGACGTGCGGGTTCCGCACGTCAGTTGGCATCAAGGAGTATTAGTGTATGGTATAGTTATTGTGTATAAGAGTGGGGCGACCTCGTTTGAGCCGATGCTTGCACATCAATGGAGCTATGTAACCGTGAAGTGAATTATTAGTTTAGAATATATTCTGCACCCAGTTTCACTCCGAGAAGTGTGTACCGCCACTCTGACTTCGACCCATAGTTTTTGGTAGATCATAACAGCGCCTTTCTCGCCTTTCCGTCAACGACATAGGAACGCATAGTGTGTTGGCTAACAAGTGTCCATTTTGTATGGCTTCGCTGGGCGCTCTCGGTGCGTACTTACTACGATAGGGGCTCGCCATCGTATTAAATTCCACGTGTCTGAAGGGAAATTCCACGTATGGCTAATTCCATTGTTGGGATAGTACGTCATCGCTGCCCCTGCCGCTTAACTGTAGGATGGAAGTCCCCAAATGACACTTATGACGTATTAATAGAACCTCACCCTGTCGCTTACACTTCGTCAGTTAGAAGACTCTTTGTCACAGGACTCAGGGTGGATAGCCCTCCCCTCCCGAAGAGTGGTGGATGAGAGTATACGACACTTCCATCGTGGCGATTCGATTAGCTACAACATCTCGCCAAAGCCTACATGGATGCCCGATCGCTACGGAATGTAAAGTTCGGCCGAAATATAGGCAGCTTGGATATTCGCGTATGATGTCTTCGGCCGTAATAATAACCTCTTCACATTTATGCTGTTGGGTTTCGAGTTCAATGAAGACGATGAGCAAGCCAGGCTCGGTGCCCTAAGCTGAACGCACGTTGATTACGTTTACAAGCAGTGTCATAGGTGGCCCTTTGGTAAGTTTTTCGGCCTCACTAATAGCCCAGCAGGTCCATGCACATCGCGCAATAGTACGCAGGTTCATCGCCGAGGGCAGACTAGTAGCTGAAGATAGGAAACCCTCTTTACGGAATCCCGGTTGGGGGTCATACTGCAGCAGTCTCAGGTAGCCCGTAATCTTCGGGTCCTAATTGTTCTTCTAACTTCTGTCTAGCATCGTACACAAGGTTACAACAAGAAGTGCTCAGAGCACTATCGGCACTTGTAACGCGATTCTTCGTTGGTGAGCTGTTACGTCCCCAACCCCGGTTCGCTTGCGAGACCATTAGGGTTATCTTCGTATGAACGGTCGAAACGGGGTGTCCCGTTTGAACCGCATCATGAGTTCATTCTCCATTACCCCAAGCCTCGGGGACGAAACCCCCCATGGCTCACGGATTCTCTTGGTTTAGGCCGCTCTCAGCATGCGAATCTGGCTGGGGGTACCCGCACATGCCTATCTCAACCGTATCTCAATTCAAACATACGCAGGGAGATCTATGCCTTCCTGTTCATGGCTCAGACCTCATGGTTGACACGCCACGCCTTTGGATTGGGAGGGGCTGACGTGTTGGCGACCGAGACCAGAGTCGCAGGCTAGTACAGCTGTTACTCATTCGATAGGACTGGAATCCGAGGCTGTTACCAACTCGGTTTCAACAGACCAAGCGGAACTCGATCAAGTCCAGACAATAAGATACGCTGAGGACCTGCAGGGTGCTGCTGATCTAACACATTACGTTGTTGTCGCCGCGCGGCTGACGTAATAAGTCGCACGATTCAACTTAGCAGGAGCACGTATCCCTCCTTCCATCCTCCCATTTTGACTCTTGAGGATAGACGACGGTTACGGTTCATCAGGAACGGGGGACTGACCCGATTGACCCTGAGACCCCCTCTTCGACGGATACTGCTGAATGCTGATTATGGACCGGACCTTTCAAGAACGAAGCACTGAGAGGGCTATTGAAAGAACAACAGAACATGGATTACGGAGCCATTGCTTACAGAATGGTTGACAGCCTAATCTTACATTGCCATCGCATGTATCGCGTGCTAAAAATCAGCCCAATCCCTCACCCCGTGGCAAGGCGCGAGACTGAGAACCCTTATGGCCAAAGGAGGGATTTGGATCCTATGGGGTCCTATTTTCGAACTACGGAGTTGTCGTGAAGAGGGCTGCCACTAGGTGTTTTTGTAAACGTGTGCGTTAGGGATCGCGGGTGGAGCGTCGGACCACCCGGCACACGCTGAGCCCTTGTCGAAGCTAAACTATATAGCTGCGCATGACAGCTCGGTAGCTCGTCAAGATATTTACGCCAAGAAGTCTTAACCCCCCTAGTTACCTCTAGTGATCTGCGCAAGTAGAGTAACGATCAGTTCCCCGTTCTAATCAATGACAGCGAGGGGATCGTCGAATTTGCTTGTCCCCCCTAAATAATGGAGCGGGTGTCATGCTGTGCGAATTTTCTTAATTCGATTTGTGATACCACTAGGATCAATCTCGTTATGTTTATTCGGGCCATCATAACACTTTCTACCGAGAGGTATGAAGTGTAGAGTGAGGGAACGTCAAAGCATCATTAATGCCGCTGATCTGCCTTGGAATGTGTCCTAAATTGTTTCCATCAGGACTTCAGATTCGCGGCAGCCGGTATGACGCGTCTATTCTCTTACGCCATGTAATACCTCAAGTCGGTAGACTCTCTCACCATTTTCCGACTGATGTTCGACCCCAATGGCTGGGCATCTGATGGAACACGGCTATCCTTACCTTGAGTCCACGGATGGAATGCATGCATGGACATGCACTGTTAGGTCCAGCGCAGGATCGGCGGCTCGGGCCACCCGTATTCCGGCCGATTACAGGACGTTTAGTTGACACAATGTTGCGACCCTCTAGTCAGTCCTCCTTCAAAATCTCCGAGAGCTTTGTTATAAGGCTGCCGTCGACGGTGATCTGCGGAGAGACTACCGTATGCGACGTCTGTCATTTCGTGTCTCGAAGAGATCTAGGGTTTCGACACCAGCAAAATGCACAAATCGCGCATGCTAACATTGTGCAGATTGCTCTTTATGACCGATTGTGGAACTATCGGCTTACACCGACTGGACGAGTTCATATCCAGAGGCCCGTTGGTTCTCGACAGGCCGGCGCATCGGCGGCTCCTGGAGCGTTGGTATGTAACGTTTTGACATGCGGTTGGGTTTGAAGTTTACACTCAGCTGTTTCGGCTTATCATCATTGGATTGCCTTCTCTACCCGCCACGACTTTGCTTTTATGTCTATGTCCAGCCTGAAGGCTAGATGGTTCGCTGGACGGTGTTATGTATTGGCGTCCAGTTCAACGAGTTATCCTTTCTCTGACATGGAATTAGCTGGATCTGTGGGCCCACAAAGTTAGCACTTTGTCGTCGGCCTAATGGATCATCGTCGATCACGTACTGTCCGTCTGCCTATAGTTGTGTCAGCATTCTGTACCTCTAAGAGAGCGGTGTTAAATCGTAAACAGTGTTGTGCGATTCCGGCTTTGTGATTAGTTGTCGAAAGCAGGGTGCAACACTTACGTGTATCCTACAGCGCAAGAAGAGCCGCTGACAAGTCCTGCACTCACGTATAAAGGTAGTTAGGGAGGAGAGTCGAGATTATAGTGCCAGGCTGTCCGCTCGCTGATACTTTCATCCTCGAAGATAGGTGAGAAACTTTAAGGTGTGGCAGTGATCCTAGTGGATTCCTGTACCTCAACATGAGTGGTTGTCTCCGACGCCGACAAACGATGCACAGGAAGGTTAAAGTCCTAGTAAGGGCCAAGTCTGATGAAATCGCCGGTTATCCCCGCATATTGCGTGCCTGAGGGGAGACGGGCGTAAGCCTCTGGCGCACACGTGAAGGAGCTTGCAGATGGTATAATGGAACTGGCGCCGAATTACTATCGGAGAACAAGGTCAGCGCAAGGAAGTTACATCCCTCCCAGAAAGAGGACTGACTCCAGACGGTGATTCTACTATGGACAGTCTCACGCCAGTACAAGGTTTTGAAAGTTTATCAGGATTGGGCGCCTAAGAGTCATGAATATGCCCTCGGGTAGTACCCCACCGCCGTAAGACTGTCAGAGCCACGTGGCTATGTTCATATCTGTCCCGACCCATGGTTTATATAAGTAGAGGTTGCACACTCGCGACGTGCCAGTCCGTTTTGCCAGCCACTATAGAATCGATTTTCCCGATCCCTATCTGTAATCGGCATACGAGTCATTCTCAGCCCATCCATGAAGAGCGGGGTCATTCGTCAGCGCGTTTTACTTGAGGACTGGTGCACGACAAGTGGTCGCCAGCCGCCGAAGCTTCCCTTGCCAACTTCCGTAGCTCGATCGGTGGCTCTACGCTGTCGTCCTCTACATGCGCCATATTAACAGTGTACCACATCGGTTGATGGACATGGGGTTTCATGCACTCGTTTATAGCATAACTAGGTGATCCGTTAAGTTGAATGGTCAGCGTCTCCCGGGAGGACTCTCCGACTCCACACGCGCGACGGTCTCAGCGTTTGTCCAATTCCGTACTCCGACAAGTCTCTCTCGGATCATCATTCAAAGGCCCAGGCGATGTCAACAGCAATAGAGGGCTACCGCCGGGACGGCCAGACGTCACTGCTACCTCTGACTTATGTTAACTTAAGCTGAAATGTTACGCGCTTCGCATATTATCGGGTCAATATATTTTCTTCCGTTCTTCGTGATCAAGGGCATGCCTTCTCTAGATGGGGACCTGACTTCTTTACGGGATAAACTCGCAATGTCGCAAGCATATGAGCCATACAGTTACTCAAGGAGTAGGAGCGGGATTGCCTGCTCGTAGAGGTGGAAAGATAGGTGCACTGTGCGAATCATGAGCTAATGTCTAATGCGCGCCTGCCGATAATTGCTGGTGCTACGTATGGTGCCTGGCAGGAATAGCGAGAGGCCGAGTTAGGACGGTCCCGGGAATTCGGAGTCTTGATATCCCACGCCGGTTCATATCCTGACTGTCATGTCTGGCTCTGATTACTACGATGATAAGTCCTCCGGTGATGGTTCTTGCTCTGACGAACTCCAGGCCTCACTCGGGGACAAATCAGGACGCGACGTCCTACACTGAATCTCGCGTCCGCCTGATCAGACATGCGACTCCATCCACCACGTTGGACTCATGACATGTCCTGTTGGCCGCAGAAAACCTACCTGTACAAACTTCGATGACGTAAAAGAGAAAGCATATGCATTCCTTCGTTAGATTTCAGATAGGAGGCCTTGTCAATCGGGGGCGTGTAATCATCACCTAGAGAATTGCATAGTTCTCTTCTTGATCTTTTGGTACAAAGAAATTATATTGGCGATGACCCACGTCAGTCAGGCGGGTCACATATTTGAGCGGACTCCTATGAGTGGCAAGCGATCTTGGCGAAGCACCAGAGCATCCCTTACTTCTACGAAGCTCGCTTAAGGAACAATCCTCAATAACAAGGTACACCCGACCCTCGCCACTGGTGACTTACATCGGTCTATGATAATTCTCCCGCCAGTGCTCGTTTAGTCCTCAGACGACCCGGACATCGCGTGGCTAAGAAATCGTTTGTACGATCGGAATCAATTTTGGCATTCTTCAGCTTCTCGTTGACGCTTATCTCAACCTTTCAAACGGTTGGCATGTGTGTGTATCTCCTGAAAATAGTCTAAACCGGAGCTGGAGCAACCTGGGCGCACGGCTGGCCAGTTTACAGATCCACACTATATGTTGAGAGTAGTCCCATGGGAAAGCTCTACCTTTTATATCGTACAACGTGATATCCCCCCCGCCGCGTCGACTTTGGGCGCACCCACGATGGTGAAAGTTACTTGCAATGTATCCTCTTTTGCCTGCTAGCGATGTCGCCGGAAAATTCCAAACAACGAATTGGGTTCGCGGGAAGCTTTCCTCTCAATTCATTGTACCGTACGAGGAAAACACGGCAACATTAACTTGCGGTTCATAATCTTGTTGCCCGGTTTCGCAAAACCGAGTATCTAATTGGCTTATCGAATACTCGTATATGAGGAACGTAGGCACAAGGTCGGCTGCGTTATGAACCGTACAGATGGCACATCCATGGTTTTGACGCGACATCTTTAATTAGAAGGCACGAATTATGAGACAGAGTTCCTGCGCAAGGGTTCTTCACGCCCAGTATACGCCGGTCGCATCACTATTGGGTTACTGAAAGTAGTTTAACTCATTCCCGGTCGACGATAGCGGTGTGATCTAAGCGACAGACTATACCGGGAAGGCTGCTCTAATAGCGACTGGCTCGCGGCAGCCTGGACTCGGTTTTGTTGTGAGCAAGAGTACAAGAGGAATTGGGGCATATAGTCTAGGATCCACTCCAAACGCTTACCTTTAAAGACGAGGCGTCGCCTGCTTCCAATAGGGTTTGCTGGAGTCATGCGATCATGTACCTGGCAGAGTCTGTTACCGAGCTGCTACCACTACGTCCTCATGTAAGTTACACGGGAAAGATGGGTCAACCCAATCCTGGACATCCTATTGCATCGATCGGCTGCTGTTAATAAGTCAGCCTTTACCCTAGAGTAGGGCCTGCTCGGTCTCGGTTCCTATAAACGGTAAACCTTCTTCGCGTCTAATAGCCCAACGCTTTGTTAATACAGTATCTGCCAGTTGCGTGGGACGACCGACCTGATTATTCATAATCTCCAAACAGACTGAGTTCGCGTGCCGATGGCAAAACGCTAAGACGTAACAACGATGCAATGTAAACGCATAAAGCGAGACTTGTAAGGCACGGCCCAGTAGTAGCGTCAATGCCCAACTCCCTTGTTCCAGGATACGCTCGACATTCAGGATGGAGAATAGGCCGAGCAGGTCCTAACGCTGCCTGGCGGGTTGCGTAACAGCTGCCCATTCCGTCGACTAACCGAATCGGTCAAGCGGTGTGTAGCTCGATTTTAAAAAGGATGTCCTAATTGACCCGGGCATACAAAGGATACAAGTAACCGCTGGCGGCAACCCAATATTGCTGCCGGGATGCATCTATTGTCGACTTGGTGGAATGCCTTATAAAAACTTAGTTCGGCAAAGAAGTCACTGACAATCAGTGTCAGGAGCTGGTAGTTAAACACCGTTGGTAAGGCGGTCGCTGAAGGCAAGAGCACAAGCAGAGGGCCATCTTGAGCCTGTCGATAGGGTTTGTACCGACAGGCGGACGCGATGCCTTCATTCCTTTCTCGAGGTGGGAGCTCCCCCAAATTCCCTCTCTACTAAAAGAAACCAGTAACTGCGTTCTGGTTAGAGGCTGGTGTCGCAAATTCACCACAGCTCTTGGAGTCCTGACGCCTGGGTTCGTGGTCATGTCCTTCGTCCGCCTTACAACGTATGCTCTACTAGTCCTGTTACTACTCAGGAATCGAAAATCCACTAGCCCGTTCTGGTAGACTTTAACGCGGCCAAGTCGACCCATACCCACCATGGGCGTTTACGCGTCAGTGGTGCTACACGGGTCGTCAGGGAACAACATTTATAGTTTACCAAGGACGTGGCCAGATAGATGTACAGGTATCGAAGGTGTGAGATGTTGGTGGAATTCATAAAGCGTCGTAACCAACAACCTCGCCGGATCCCTACCCTTCCGGTCGGATGCCTTCAGTGTGCTGCACCATGCTTTCAGGAGTGGAACGTGCCAGAATTCGTTGTGGCGGCAGATGACATCGCTATCGGCCAGCTGCCACTTATCTCCCAATCGACTTTTGGACCATTGGAAGTTACTGGTGCCGGCATAACTAAACCCAGGGTGGGGAAGGTCAATCGAGTCCCGTGAAAAAAGATCTCGTGGAGTGAGGACCACGGGCCCTAATAGCCGCCGGATTAAACAGGACAACCCGACTAACTCTTTACCGCGTCGGGACGTGGAAACCCTAGTACGAGGCTGACGTCAATTGAAAGCATGTGTGGGTTTGGCTAATAGGCTACACAGCAGTTACTCCTCTAATGGTGTGGTCCATGTTCAAACTACCACTCTCGTAGCAGACGAGACGAAGAACACAATACTACTGTGTCATGAGTCTACCCAGAAAAGTCGTGCTACGACGAACCTTTAACAAAAGGATTGTTCGTCGAAAAGTTATCACCCATAATTGGCAAGTGTCGTCCTTCTTACTCCAATCGCCCGTCACTGATTGGCGGTTCATTTCAGCCATGCTTACCGTACGAACTCGCGCATTGCCGTTGATGAGCTAATAGGGTTTACCATTTGCTTCCAACGAGTTGGTCAGGTCTCCAATCTAGACACATTGGCTTCTGCCCGAATTCACCGGATCGCCAAGACTGGCGATACGTCATTGTCATTCATCCATAACATGTTACTGTGTAAATGCTGACGTACATATGGTCAGTGTTACGAAAGAGTGTAACCGGGTCACGTCTTTCTACATCGATTTAGCCGCGCGCGTCTGCGCGCGTCTCCACACTTTCTAAGAGGCATAATAGTCTAATGAGAATCGTACTTCTCTCTATTAGCAGCCTATTGGATGCTCATTGTGTTAGGTTTATCAAGCACGGCTGGATGCAGGCGTACTGGTCACGACGATCAATTGGGCTTCCCAAGCTGGTCTATACCTTCCGTAAGAAGTCCAAAGTATAGGGAGGCGTTGTCCGACGGTCTTAACTAGCCTTGTGCCGCCCTAGCCTTGGGACGAGGAATATCAAGTTGGCGGCTCTTTGAGCGTTGTGGAGCCATGCCGCTCCCCGGGGCCGCACTGTTTTACCTTGCCCCCAGAAGAACGTGTGGTTTATGGACAGAGGCTTCGCCATTATGCAAGATTGAATCCCTTGAAAGTGCTTTTACGGTTGACTGTTAGATGATCTCAGAATGAACAATACCCCGTCACTGGTTAACCCTCGTAAACACCACTTAGCGTGCTTGCTGACGGCCCAGTCCCACGAGAGCATATATGGGCCTCAGTCAGCGACTCATACGGCACCTCAGTGACCACCCCTTCATCCCACCATGTTAATAACCCGAAGAGCGAGGCTTGGCAACCAGTGTTCACACCCTAAGTTTAGACACGCATTGCCTAAAGCGCGTTTCTGTCGGGAAGCTAGCAAAAGGTAACATCGGATAGGACCCTTGGTAAACTTCATTTTGTATCCTGTTCCGATCGGCCTGGCGTCGTCGATTATTAGTTTTTGAATCAATGAAATAGCAGCCGTCCGGGCCAATTCAATCGCTCAACCATTTGGTTCAAGGTATCCGAAATAAGCGAACTAGAAATCGCGCTCCATTTACTACGCTGCGCGTTTAGTAGGTTACTCTATGGAGATGACATAAAAAGTGTCAGAGCGGTCAGGCAGGCGAAGGAGGCGACGAGCCGAGACAATTGGATCGGCATTTAGACTACGAACCAACATGTCTTACGCATGGATATGGGACATATAAGGCCGCTTTATCATGATTACAACCACCCTAAGGTTGGACTTCTCGATTCGGTGCTAGGCTCCATACGTCGTCTGTCGGGAGTCACTGATGTAATTACTGTACCGCGACACAACTATTTGCATCGCATCCGCTAGGTAGACCAAGGTTCAACGAACGTCAAATCAGTCTGTCAAGCACGTTTTATCGGACGCACGGTGTAAGCCGGGTATACTTTCCTGCACCGATGGGCAAAGCACGTAGCTCACCACAAAAATAGGCCGCCTAAGATGACGGTCTTTACATAAGACAAATTACATGAATTAGGACGCGAACGGACCACCGCGGCGTAACGATGATGATCAAAGAGTCAGGCAGACACGTGCGAGCAACAGTCAGAATTCTATCCTGGCCCTGATCATCTCTCGTGCCCCAGACGATACACACGAATTTAGTATAGTGGTAAGATATACACATCCGCATCCGCTCTTAGTCTCACATGGCTCTCGGCAAATTTCAGCTATCGCCGCGGCCTTTACCTTCCCGTAGGATGCCATCCTCGCTTTAATGACGTCAGATTGAGGTGTCGTGTGTCTTGTATGTAGTCCACACTTGCCTTGGAGTGCCGCTGCTTGCCTGCGCCAAGTCAGGATATCCACGCTGCCCGCGACCAATAACGTAGGGAAGCGTGACTATCGTCCCTGTAGAATCTATTCTTAGGCCGGATCATATTAAGAAGGTACATCCCCTTCTAGACATAATGTGACCCGTGGATCCTCTTTACATCCGTGTTCTACGACGTCTTGCTAGTCTGCATCTATACTATACTTCAAGTGGCCGGATGTAGTGGAAGGACCGGCGTTTTTTAAGAGTATTCTCTGCCCTCGGTCTCGGTGGAATTATACATAAAATTTTGTCCGCGACTGCCCCTCCCAAAACGTTGCCTGTTCACTTTACGAGACAAGCTGCACGACTAGAGGTTGAGAGTATTCGGAACACTATGAGGTTCCTGAGCGGTACACTCTACAGGCGCAGTGGTCGCCGAATCATAACGTGAGACGAGTCCATAAATATAACCTGGTTTTTGCATGGGAAGTTTACGGGCCAATTATAAGTTGGGACATGTATACGTCAGCGGAAGCGCGCTAGATTAGGCCTACATATGCTTCGATGTAATAGTTTCTGGTAAGGAATGCCCGGATTAGAGGCTTTACAGTAGCTAGTTCTAAGAGAGTGATTATCTTTGTCCGCTTTGTACAAGGGAATAGTTTCCGGAGGATGTTCATGTGACGAAAAGCTCCGCAAGTTGGCGGGTACCTCTGCCCCCTATCAAGCCTTAAATACACAGAGTGATATGTATGAAGGCATTTTCGTGTTAAAACATCCACTAGCAGGGTCGAACAGCTATCACATCTGATATAGTGAAATAATTCCTGCCCACCCTACTAACAACCTTGGCAGAGGCCGGGGCCGAGCGCAGACTGTTTAGGACGTGTTCGATTTGGAATCCAAGTGTCCCGAGAGTCTGCACCACATCCGTCTTGGTCAACCTTAATGATGTTCGCCTCGTTCACGAGCAGGTGGAGTGCTAGTACACATAAGTCTCTCGTTACACCCGTTGGGGTTGCGCTAATAGCCAATCTCCGTGTGCGTCCATACTGTTATCCCGAGAAAACCCTTTAGCCTAGACTCGACGGGGCCAATGACGGCGACACCGACCACCAATACATGGTAGTAAAGCGACCGGATAGTTACCTCGTGTAAAGGTAGTTTTGGTGTAAAACCCTGCCCCCTACGGGCCATGAATTCCAAATAGTTGGGTCTATACAACGTAGTCCTGCACGCGGTTCAGACTTGTGGATGCGAACATTTAGCGCTTGAGCCAACAGTCTAACCCTGCTTAATTACCAAAGCTAAGACCTTACCGCGGGTGATCGCCACATCTTTCATCCGTCGAAATATAATGGCCACTGGTACAACATCGCAAGCTCACGCATGTAGCCCAACAAAAGAAGAACCGCAGTATTACATTTAGAGCAAGAACCGACACCTGTGTTGTGTTTGTTGAGTCCCCCTATCTAGCAACATGAGAACTCACGGAGTCGTAATCTATCTAGTGAGTTGCGCCACCTGCAAGAAAGTTCACAGCTTGCTTACGTCGACGCAGCGTTCTGGTTTTACGAGCCGCGACCCGTTCTCCGGGTACAATGCGAGGACGGGTGGACTCAACCCCTCAGCGGCTCTTTAATACCGGATAAGAACCTTGAAGAAGTCCCTGCGTGGGCACGTGTTATCTTAACGATCGCTCCATAGATTAACTTGCGTTTTGTTGAAACACATACGTAACCCGTGCGACAGCTGTCCAGGCCTTGTTATTCGCATCACGGTCAAGTTCCACCTTCTGGGACGTTGCTGTACACGCACGGGTTAATCTATTGCGCGGAGGCTTGGCATAGGCGCTTCAACATTACAAGCCACACATACAGATATCAGGGACTGCAGGCCATCAGTTTTAGTTCATGAGTGACATCCCGTGGAGTGTGAGCTGAAGTCCACGAAAGTAAGCTAAATTCGTCATAGCTGTTAATGACCCATTGAGGCGGTGCGTCACATTTTTCTTACCGATACTAGCACTGCCTTCGGCGCAAGTCGATTGCTGATTTTTATCACGGCGATCTCTATCGGATCGAGTCAGAAAGCCCCTTTACTCGTGTATTGAGACTGCTATAATTATCGCATGTCGGCTGTCGCTGCTATATAACATCATAAACTAGGTCAAAACCGTTGGACCCTGCACCTAATATCGATTCGCCGCACGAAAACCGTCGAGGACGGTAACTATCGGCTGGCGTGACTGTGGCATGCAAGCCAATCGTAGGGCGAAATACCATCGGTACCCCGCACGGTCAAACCAGGCTTAGCGATCAACTCTTTCCGCGCGGCGTTTATTTGAAGGAATTGATGAAAACTTATTAAAGGACGTTAGCGAATGCTGCCGATGATTGCACGTATGCCGGCACCCGCTAAACGTACCGTGTGCATTTTCCGGGAGTTTTTACCCCCCAAAGGCCCGGGATGTTCATTAGCAGGTCTAGTGCGCCAAGGATGGGACTGGACGACTAAGGGGCGCAGCGGCTCTAGTAACAATTGTGCTAAGAACGACCTCGGCGTGGACCTCGCCATAGGCAAGAATTCGTGCCAGGAAACACTGGGGTGGAATGCGCTCTTAGAGGGCGTTACTAATCCGTGTTAAAACCTGTCCAAGTCCGGGACCCCCTGCTGCTCTGTATTCACTTGTATGTACTAGGCGACTTACCGTGAAGGTGTAGTTCACAGTGGATTCGCGAGAACAGAGAGACTTCCCCTAGATGGTGACTGTTTCATCGAGCCGGCGAAGGGCTTTTATCTTCCGATCCGACGCATTGACTTCCTAAGGCAGGGAGAAGGAGCTCAAAGATGCATCCCAACCTTCATTCATTGGGACTAAACGCTTTATGACATATCAAATTAGAGCACATTCTTACCCTATCTCGTTTACTCGGAGAGATAAATAACTTAATCTGAACGTATATGAGATGTGTCTGCACGCACTGGAGGGTCCTCCCTTACATCACGACTATATTCTGTTAACGTTTCGTCGGCACCAGTTGAGATAGAGGTCCAACCAGTAGCAATTGGTCATTCTCTTAAAGAGCAGGGTGGATCGCACAGGTAGCGTCTTGCTTGTATTAGCAGAGAAACATCGGATTTGTAACCCGGACCCTGGTTAGCGTTGTTGATCTGAATAATTCGGGTACGGTGACATTAATCGCAGGAATGCGTTCCCGCACAGACCGCAGCTAGTAATTTTTTTTGCTCAGAACCATCAACTGACATCGAGACAGATGAGCGATCGTATAATCATCGTCCTATCGCGGCGCTATAATCACTGTCAGCGCGGTTAGATTACGTACCTACTGGACGTCGATTCGCTGCAGCAGTTATCCGGTGCGAGACTGCCGTTACAAGGGTAGGCAGTAGCCCCCATCAAGGCTCCCCGTCTGAATACTTCTTCCGAGTCCGGAGCCGGGGCCTAGGTAGCTCTATTGTGGAGCATCGTGACGGTCAGTCTTCGTGTCTTTGGGACCTTTGTCGGCAATGCCCCTCTGAAGTGCATTAAAAATGGGGAGGAAGCGCAACACGATAACGTCTCGCGGCTGGATGTGAATGTTAACATACCATTAGGCCGGCGCCCGTAGCGGTCCAGACACACCGCAAGTACGTTACCTGGTCGATCTGAGGCTCCTGTCAGCGGCAATGAGGACGAAGTCGGCTAATAGGGTTTCAGCACGTCGGAAGCATTAATTCGGCCGAGGGGATGTCCTCCCGATCAACCCCTGCCGCCCGCATTATTAGTCAATGACTCATCGAGAGGGCCCTGCTAGGAGGTCTGCTCGCTCTAAGACACTCGTAATCGGTTGGAATTATCAACAATCAGCTGACGTGCGAACGGTACTTTTTCGGGAGCCGGTAGTGCGCGGCTACTGAACTATGACACTAGTCAATACACTCAACACACTACTGCAGAACACTGTGGGCGAGAGATGAAATACCATAGGCGGAGAGTAAGCTCTGCATGAGTCCTTGACTTGTTGTGGCCAACCCGACACGGTCAACGGCGATGTTGAAGTACGGGTGTCCAGCGTTCGATGTGATTTTTTACTTCCCGATCTGCTGGATTTTCGACTCAGTGTATGAGGCCCTGATTGACTTGGTGTATGGAGCGGGATCGACGCTGCGATGATCATATCGTTCCCGAGGAGCGAGAAGGCGCAGGGGAGTCCCTTAACCGCAAGTATACCTTAGCAAATGGTCATTCTTACTCGCTAGGCACCGAGGAATATTTAAAGGACTCTTTTCTATCACAATATCCATTTCGACTTCCACCACACTGACAACGGTGTCGCCGTCGGCAGGCGAGTGAGGGGATACAAAAGGACATCGCTAGCGGTGAGCAAAACTAGCGCGTACTCAAGCGCCTTCAAATGTAGAGGTCCTAATGTAATCGTTCTGGATTGAAGGTATTGCCCATGAGTCTATTCTAAGTACTGTAATTGTTAACTAACATCCTGGTACGGACGGTGCGGACCCAAAAGAGTCCTCGGAGCCGTGTATACGCTAACTTGCTAGTTTTACCCATATGAAGTTACGTTTAGTTCATTTTGAACCGGACAATTATACTAGATTGTCCCGACAGATGCTCACGGTGACTTAGATCAGCGATAAGTCCTTATGAAATGAAAATCCAATCCATATACATACGCCACAACCTTGCAAATCGAATGAGCGGCGCACCTGTTAACGTGCTTTGCTCATGACTTCCCTTATCCCAAAGCATAAGCTCCAAGAGCCTAGAAATGACCAGCCGCGAGAAAAGACGTCAAGTCCAACGGGCCTAACATGAGGTGCGTCGGCGTTATAAGTAGGGGGAAGGTCGATGGCTCATGTTCAATAAATTGTCATCAGTCAGCTAATAAAGTGCAAGCATACAGATTCAAATAGTAGTTCCTAGAGGGACTCAAACTCCACAACACAAATCACCAGCGCGCAAACAGACTCATACCAGGCCATCTTCCCAGAGGACTTGAGAGCAACTGCTGCCGCTTCTGAGATCGTATAGCTTGCTTAACAGACACACCAGAATTCTGAGGCATATAATTCGATCCTTTGTACGCACCGGTGGAAATCCTACATCGAAGTGATAGGAGAAACTCATAGCATGGTGAGGTCATAATCATAATTCTGTCATGTGACTACGTGTCTGAGGTTGTTCCCATTGGACCGCTAGAGTCTCGTAGTCGTTCTCCGTTCCCTTGTATACGGACCATCACGTCAAACTCGGAGCAGTATGAAATTGTGTGTCTCACTCCACGGAGGACCCTGAACGGTCAATCCCGATCCCGTGCCTTACACATCAGCTTGGGCTTTTGTTGGGTAGCCGCTGCGCCGCTGATCGCCGTCATCCGAATCACCGCTTCGCATTAAAGGGAGATTGCTGTGATGATACTTACTTTAGCGAGATTTGGGGACACATGCCTTGCGGATGCTTAGGTGCAAACCCATGAGCGAGTCCCTATAGGCTGAGATCCATCGTCGGGGGAGAATATTTGTATATCCATATGGACCCGGATGCTCCACAGATTTCGAGCCATGAGCTAGTACAAGTGGAAATTGCACGGTCCTTGGGACGAGGCTTCGACCGTTATGACCAGCTCATAGAAAGTACCCGTGTGTATTGGTGAAGGAACGGAGCGGTACGCATGGAATCAAAGCAATTAGTTTGTGCGAGTTCGACCTAACGTCGACAATAGCAAAGCTTTGTACCAGTGTTCTAGGGCTTAGGGAACTTCAGAGGCTCGCGATCGTTCACGAGATGAATATCGGAATAATTATTCGTCCGAGTGGGTTTCTTTGTGAAACACGTGCCAGTTATAGGGGGGCTGGGACAAATAACGTTCCTGTAGGGATCTTATGGGCGTTGAACTGGCTTAACGAACAAGATACTCAGGTGCCGGACGTCAATGCGGGGTTAGGTCCCGCCTAGACCGAGTGCACGTGCGTAAGAGTGGTGTTTACATGCTCCAGAGGCCAATTAAGGAAACACCAATCTAGGGTGCGTTGTTAGAGTGGACAAATGTGTATTCCGCTCTCTTAAACCGAATCACATCACAACGGCATGTCGGCGATAGGAGTAGAGTAGCAATGACGCTCTAGTTAGCTGACCACTAAGAATTGGTCAGGACTGACCCAGACTAGCGAGGACTCTAGCTGTAGCTGAGGTGTCGCCGAGTTGCGTAAGCGCCTATCATCCCTTTGGGGTCATCAAAAAATGACTCCGGATTCTATGAGCCAACCCGAGTAAACCAATGATTTTAGCCTCCGGGAGTCATACTCGCGGAAGCTCGGGATAATAATGAAAGTCAGGCCTTCCTCTCAGTGATTCACCTATCCTCCTTCTCTAATTGCTGCTCGGTCCAGTGCCATGGTCGTCTTACATCTAAGCCCTAATACCAGATTACTTTTTCTGCGCAGCTATCGCAGCAGCAATGTACCACGAGCCCGCATGGAGCCAAGCTAGAGCTCACCATTCGTCGCTGAGAGCCGTGTAACATTGGTCCCACAGCCATATGCGCATACCAAGTCCCTAGTCAGACTAACTCTGGCTAGCCAATATCGACTCGAGTTGAGAGCCGACCAAAGAACCCACGCGCGTATGTTGCGTTTCATAAACGGATTTTTTGCTGTAATCCAGCGTTCGCTTATCGGTGATGGTCCCCAACCTGCCGTGGGACCGACTACGCTAATACATTAGCACCCCTCCACCTAGGGTTAGGAAGGGCCATCCGAATCCCAGGGCCCCCAGAATCATCGAGATGTGTATACTTAATGCTGCATGTCCCGGTGTGACTGCGACACGCCCTTTAGAGGTAGGCTTTAGTGATTGACTCCGAGCATATTGCAACTGTCATCCCCCTTCCGTTTACCGTTACCCTTGCAGAGCAAAACCCCTCGGACCCGCTGTATCAATGTTGCCTGTCGGATTGGAACAAGTATTAAGTGATATTTCTATATACTCAAGAAGAAAAGCCAACATGGGATCAAAAGCCAACCGTTTGCACCGCTATCACATCGCTAGCGTTCCAAACGAAGCATGCATCCCGAAGCCATGGAGATCGCTATAGGTTGAAAGAGATTGCTCTCACCGACCCTCAGCCTGAAGATAGTAGGGTTCTCCTATAGGCTATCGCGACGTGTATTTTGCCTGCTCATTACTGCACTGTCGGTTGCCGGGATCTGCGCGGCGGCCCTTACTGCTAGAAAGGCTACAAGTATCACGGGGGTGGGCACAATATCCATTGTGTGCCCGCTGGACCTACACTTTCGCTGAGAGGTTGGCGCACGTGTCGCGTGCTAGGGAAACCCGGACAATAGGTCCAAACTCTGCCGTTGTGTACTGATAGCTCCACTCCTTCCGCACCTGTTACCCGCATTGTAAGACCGGAGTGGGATTACCGTAAACCTTGTCGCTGATTAGGCGCTCGTCCGGAACATCAGTTAAAAGAGTCGTGACATGCGATTGCAAGGTCCTCTCTAAGAAGCCGTCTGAGCAGTCTATATTCGAGCTCCCTCCAGGCTTCCCATCCCCCATTAAATTTTCCGTCAGTTAGGGAGCACTCGCCTGGTTGTTTGATGATATGTTGTACTCCCCGGTGCGTATACCAGTCGTCGACTTGGGGGGCTTTTCTCCTTTCTGCGTATACCTAAGAAATATACCGACAGACCGTCAGAATGTATTATACGCCGTGCAATGTGCATGCCATCCCAACTGGTCCCCACGTATTGACAACGTCGATGATTCTGGAGTTCTACGAGCACGCTGCATCAGTTGGGACATAGGCCATGCTACGGGCAAGAGCTGTGTGGTGACGGATTGGACCGGAATTTGCTTAGGCTTTGAGTTTTAGATACTGAAGCGGGTGGCTATGAAAGTAGTCAACTACTATAGTGGTTGGCCAGTTTGCTAATGACGGCATGTGTGCATTTATTACCATATAATTCAAAAATAAATCGCAGGTGGAACCTTCTAAGTCTTCCACTCCGGGGTAGCTCCTCTGCATTTCGAGCGAGTCCGGATGAGGCCCGGGGACCATTAATTGTAAGGTGGGTGCATTCTCCTTGTGTATTGTTGTCTTGTCAGAAGGCATTGTAGCAGGTCGGCGCCGCGTTGCACCGCATCTGCGATCGCCGCTGGAGAACTCGTCGGTAACTTATTGCAACTCTCGATGATCGCGGCGACACTCGCATGCGCAGAGCTGCTTCATTATGGGTCCCACAGCAGTGAGCCGACAATTACGTGATGACGTGGGGTCGTGCGCACATTCTAACACCTGGGCGAGGTAAAAAGTACTTCCAGACCTTGACGCTAAACGGCTCACCAAACAATTTTCGGTCAAGCGAATGGTCCATGTCTCACGCGAGTTTAGGGTATGATCTGTATTCCGAATAAACACTCAGACTATAGAGGGAGTTCACCGGGCGTAGCCTGCAATTCCACACTGGGTCTTGCTAAAAAATCTAGTCTGCCCCTTATAAGCCTATAGGGAAGGTGACTACAAGACTGTGTGTTGAAACCGTGAGGCAGGGAAAGAGATAGCGGTCAGAGAACACTATGATACTTGATGGGGCTCGTGTAGGACTTGTCTTAGGTTGAAATTTTTACATGCTTAGCATATCACATTAATCGATTTGCGCCGCAAGTTGTAGTTAATGGATCCATTGAGATTGGAACACGCCGAAAGACCATGAGGCTTGCCGTACGCAGAGTTCCATTCATATATCCTAAATGTGCTTTCTGGTGGTATAATGATTTTTTCATCAGCGTCTATGTCACAGTCCCACGACGCGCAATTTTTGTGACAATCACTGCGTCTCGTCTCCCACGCGTCCCTAATCGAACGATTTGGATAATACCGACTAGTCGTGGCCCAGATAGTTTGAGCTCACTGGGGCGGTTCGTGGTGTTAACTGAAAGGAGACGGGCCCAGGCCAATTCTGAAACTCACCACTAGGGTGGTTATTGCTCATCCCCGGAGGAGGTCCGTTTAATGGGTACTCGTCGAGTTCCCCCTATCTAGACGGAGTGCTGCTGCTGGTCCAATTTCTCGAAGATCATTCATTTTGATCCAGAAAAAGGAAACCAGCCGATATCGTAGGTTTCGCCGGTACCGCACAATATGGCATGCTTCTGCCGCACAATCTCTACCCTCTCCTTCGTTCCCGAGCTCAGAGTAACTCCACAACGATAGCATGGGTGCAGAATAACGTCAACAATTTGTCGATATTCAAGTATCGTGGCTTGTATTGGCGACCTCCTCCACGTCTAATGCGCGTAGAATTTTGGTGGTGATAGCAAGGTGGGTTTGTTCCAATAATAGTATTTGCTGACAACTGATATTTTAGTCGTAGAATCTGACCTTTTACGTGACTGTGGCCCTTCATCGGGATAAGACCGCGGGGATCGAATTCCTGTTTAGCAGACCAACATCCCGATGTTCCACGGTCCCCCGTGGCGAGTGGCACTTTCTCCGCTAATACATCTGAATCCGTTGGGCGGAGGTCTGCCATGTCTACTTCCCGGGGGCCTCCAGACGAATGAGTTAACCTAGGCCTACCTAGGACCACCAGTTTTGAGTGAATATGACCTTGGGGATTAACAATACAGTTCAATTAATACGTGTCATCTAATCTGCGCGCTACACTCTCTGGACCCTGCTCGAGCGAGGCGAGCTCACTAGCTCATTTTTTCGCCGCCCCATCCGTTTGACTAGACCTTTATACAAGGGAACTGAGTTCTTGTATTACGCGACTCGGGGTCTATATTGGACGGTCCAGTTGTGCCTGATCTATATAGCGCCGTGACTGTATAGTATCGCAACGCAAAGTTTAATAGTCTTACTTGGTGGAGGACATCCTCCTACGATTGCGCGATATCTCAGCGTGCTCATTGAATTGCAACCCCACTAATAGAGCCGAGTAGCGGACTTGTGATAACGGAATCCTTCTGTCAGTGGTTTCATGGCAGAGTGCTTAGCCGTATCTGTAGGGGGGGCTTTTTACGAGGAGACTTCCCGATCCAGCTGTAAAATTATCCGGTTGCTATGATTCGTTATTAAAAGCGGAAATATAACGACTTTGCGACGGAAAACAATCCCCTGATCAGCGTTGGCCGTACTTAAACACTGCAGCGTTGCTCGCGCGTTCAAATCACCCTAATTCTTTAAAGCTTAACCATCACCGGTGTAATTTTTTTTAAAGTTGGATCTGCGACTACTCCACGTATGATTCACGCTGTAACCTAACGAGTACGCTGCGGGGGCTTTCTGCAGACATGACTGGCGCATCTGTATCACTACTGCTCTAAGAGGAGGATTCCTCGAAAAGTAGCTGTTATTCTAGTCGAAATTTCCGAGGAACTAACCAAGACGATTAGCCCTTCAAGCTGGGGTCAATCGCAAGCCATTATCCGCTAGCTGGGGTGCCAACCCTGGCCAAGTACCTATCCACCCTCTTTAGAGACTCTCAGGTGGGCAGAGGTCGACCTGGGATAATAGATTATGTGCGTGCCCAAACAAGCTGCTCCAAATTGAGCGTTATGTCCATGATAAGTTGTCTTTAAAGGCTCAGTAATTTGTATATAAGGTTGAGATATTCATTCACATAGATGAGACGCGTTACGGTACATATTTCTTATAGTATTAGGGACTCTGCGGAGGACGTAAACTAAGGATCTACAGACGTAGGTCCTTACCTCCTAAATCCTCCGGGCCAACGAAGGGAGTCGTCCCGCGACGTAGTGCTAATTTCCCGGATGGGCTTCTGGTAGGCAAGTTTCGTCGCCCCTCGCAACGAAGAAAGAGTAATTTATACAGGAAAGCCGAGTAACTTAATAACAAAGAAAACCCGCGTATCGTCCGTAGACATTGATTTAGGTGCTGGTGTGAGAGGTTCGCGTGCATTGACAAAACTCAGAGGAATGCCCCCATGGAGCGGTGGAAAAGTGGGCGGTCGGAAAAAGTCGGGTGTTCCAATTGTTCTTCTTGTCGGTAAAAATGCCTTAACACTCGCTCAGCTACTCGAGGAATCAGACTTGATCAAGGGGCAGAGCTCATCATCTTGCACCGGTAACTTTTAGGGTGAGTGTTCGGGTTGTGCGCCAACATTTGGCTGAAGAGTTGGCGCGAAACATGAGGAATGCCGGGCACTTGGGTGTTCCCCCGAGAAGCTCAGGCCATTTCCTGGAGTGACAATCTTTCGTATCCTGCGCCATGTTTGGACATGCCTCAACCGTAGTGGCGCGCAGATTGCCGTTGGTGACTGAAATCGAAAAACCAGCAGTCGCCCCTTATTAGTTACCCCATGAACGTTCCAGTCCTGCTGAAAAGTCCCAAACGACAGGACTTTGTACCCCTGCGTAAATGTATCACTAGCAGCCTAATCTCAAGCTGAGGGATAGGCGTCCAGTCAGTAGTTCTTCATAAGATATAGAATTTCGGTGGTCGTAATTTCCATGAGGCATCGAATAGACCTGAATCGCATCCCCAGAAGAAACGGGTCTTCGACGAAGTAGCGGAATACGGAACAAAGCGAGCCGCTTCATTTGGCGTTCAATGGGCTTACGCAACCGTCATAACGATCCCCTGTGAATTATATCAACCCTTTTCGAAGTCAACAATCATGCAGACCGAAATGGTAGCATTATTCCCGGTGTCGTACCACTTATCCGAAATGCAAACCTCGTGGAGCAGGGTAGCTTTGTGAGGAACGAAATCTTTAAGTGAAAAGATACTTAGCACGAGGCATTTGAGAACATGAGCGAGGAATACGTCGTCATCCTATTCCTCAAAAGAGACTTGATTCAAGCGCTAGCTACCATAGTGGAACTGGGCCCATCGGGGTGTAAGGAAGTGGAAAACGTGACCGCGACGTGCACACAAACTTTGCTCTTTTGCCACAACGCGTATAGCCTGAATCGCCTCCTGAGCACTTAGACACGTGTCATCCCGGGGGCTAACTAAAATACGGCGAACATGAGCCTACGAAAGAGGGGAAATGATCTTGCGGCTCTAAAGAGTAAACATGGACGTTCCCCCTTGGAAGCGTCCGTCTGCCGCCGGGGTCTGAACATTGTGCCTACCTCAACATCGACATGCCACCGTTGCCGTTCCTCGGCGATACTTAATTGAGAATAATTGAGCAGGGGCCACAGCGCCAGACCAGATCGTTCGTATTATATTTGATCGACCACTGCATCACGCTCTCCGCGTATAGAGTAATCGGCACGAATCGTTCAAAGTATTATTCTCAAGCGAAAAGGCTGTCTATAGATCGCAATTTTAGTACACCGACGGGGGTGTGACTACAGCCCTAAATCTTCCCCGTATGTCTTCTACGTCTGCCTAAAATACGATCCATGCAGCCGCGCTCGGGAAGCGACATAAAAGGATGCAGATAGTATGGTCTGAACATTAGACGTCGTACTTCGGGGAGCACCCTTTCACCTAGTTTTGTTTCGATGCCAGGCGATCCTTAGCGAACACCTCCGGAAGGGTCTGGATATGCCCAGGTGCGGTGCGCGTTCATGCCCTCTAATTAAATTAGGTTGACGACCCAGGCACCGGTTCCCTGTCAATGCGGCTTACACCTACACGACTTGCACGCGTTCGCAAATCGTCCGCGTGAGCTCTAAGCGTCTCCCACTATAACAATCCTCCGGCCCAGGTTGCGGTAGGCTTTCCACAGAGTTAGCAGAAGGGGTGTGGTTAAAAGGCTCCTCCAAGATAACGCTGTCCAGCTCAACCCATTACATCCCAAGTTTTGCGGATTTGCTCGTAACCTGACAGAAGATTTGCTGCACTTCCCAATAGGTTGTTGCAACTGCGACCATAGGCGCCATGTTTATTTGATGCGTTGATCCAAAAACCGCATACTCTTCTAGGGTGCCCTATTTTCCGGGAATCCCTTCCACTACTTCTAGCGTACTCACTGACCCTATTAAAGGTCATATATTCACCTCCCTTGTCGTATCAAGAATACTGATTAGTAGGATCAGGACCGGTTCCTTAAGGTGTATATTGGGACCGAAGTTCTTTACAGCATTGTACTAGATACCCTTATAGGAGTGCCCCATTCATCAAGAACCTCGTTATAACACGCACGCAGCAGATGTCCGCGATGTGTTAGCACCTAAATGCTACCCTGAGGATATACAACAACGAATCTTCGAATGTCTAATCTTGCCCTACCCCTCGACTATCGACTGGCGCTGACGCATGCACAGTTCACCCTTGGTACAGGGTGCAAGTCAACCACTGGAGCTAGGGCAAACTTAATGTGTCATATCGCAGGCAGAGGTCTCCGAAATGGAGAGACTAATTTTGCCCCGCGTCGTCACAGGGCAGCGAACCTATGGCTCTGCCGGGAATAGCGCAATCCATGCGCAATTGGGCAGCTGGAAATACTAACACAGCGATTCCTAATCGCTGAGCTACCAAGCTTCAGCCGCGATCCAGTGGCTGTCAAATCGCGCTAAGCCCGTCGGGGGGCATTCAAATCGCAGTCTGGGAAGACTTGTGAATCAAGTCTCAAAGGAGGGACAATTGGATATCAGGGCGAATTTTTAGACTGATCATAAGCCACCAGAAAAATGAGCACTCGACCCGGCGCCTTTCCTACCCAAGACCTTGCATAGACAATGCCGTGCCGTTGACTATCAAGCTAACCTGTTCCAACACCGCGACGCGATTACGTTTAAGCGCTAGATAAGGGCTTAATTTTATTGAGCCGCCCGTACTAGGCTATTACCTATAAGTGCTGGCATCGGGCATAGGCCATAGGTTCGATTGCCTGTCGTTGTAAACGGCCATAGAATTAGGTTTGTGATACCGTTTTGATAACATCTAGACAGGTCGGCGCGAGTTGTGTGCGAAGATAGTGCCTCTCGTGGTGGTCGTACCATGTCAATATTTTCCATTTATTACGGCTCGTATAGAGCCACACCTCTGCCACCGATTTACCACCCGGTTCTACGTCTGTTTTATTTAGGAGGAATTCGAGACACGTAGCAAAGGTCATACTAGGTCCACGCCCCAGACGAATCATGACCGGCGCGTCTTAGCTTGCACCCGCTGTCACGATAACCTTTTATTCCTTCTGTCTAGCGCCTGGTTGGTTGCGATATCGCCCCTAAAAGTCGTCCTGCGACAACTTGCAATCAGAACGAGTGATTTATGGGGGCCCGGGACTAAAGACGGCCGGTTAGACTGCCCTCTCGCGGGCTTTTAATATCTTCTTTTCTAAAGGCGCCACTAAATTACTGCGAGCTCTATTCCTTTATCATCGACTATGGGCCCAACGAATTGCTTAACGTCTCAGAATTCCCTATGTTTCAGAAAGTCAAACCCGCCACAATGATCTGGATTTCCTTGACATTGTCGTGTGGCAGCAAGGCTCGCAGGTGACCACTAGTTATACAAATTCCCCAACCCCCCCATTGGGACCTAATAGGCCATGTAGTCTATACGCATGACTTATGGCGTATTTAACCGGCGTGGCACCGATCCCATCGTAGACCATTCATCAACAAGCCTAGATCGTGCTTTTCAATAATGACCTGAGGACTTTTGGTCGGACGGATAACCCTCAGCTTTTACCCATGTGGGCATCACAGCGGCTTGGGACACTGCGTCGATAGCTCTGAGTTAGTATTCGCAGTGTTACTGTAAAGCAGTGCAAGAACGTTTTCTAGACTATGTACCAATCTTCTTGGAATTTAGCCGGTCCACCGCGACCCTATCCAAGTAGAACATATAACGACCGGATATCACTGCCACTCCTGTCGCCCATTGACTTAGATACCGATCTTGCAGGGTCGGCATCAGAAGATAGTTCAGTAGTCTAGCGATATCGGCAGCCTAACGGAGTATGTCAGTCCTTGATACTCGAACGCTTGCACAAGCCATCTCCCATAGTCAGTTGCGTGGCACAAAAGTGAAACCCCATCCTAGGCCCTCTTAGCGTCACGTCACCTTTCGGCGGTTGATCTGGTAGAGACAAGCGACAATGCACAGGTAATCTACTAATTAGATCTCATCCGACGAAGGCCTACATCTGCCGCAGTCGGGATAGCGATCTGTGGTTGATCCTTTTGGATGTGCAACTGCTCGCTTCTCTTAATCAGTATTTAAGGAAGGCTGTGAGGGAATAGCTGTACCCGGTGGTACACTTTAAACCGAAGTGTGTACCAGTGGTATGGGAAAGCTTTGAGTTGTGCAGCGGTGAGTGAATGGGTCGTGCCGCATGCCTCTCTTGGACCGGAATTTAATAGTGGCGGCACAGATCCCTTCATAGATCTGGATTGGATAGCATACCGTCTCAGCGTACGGCCATCAGCTTATGACGCGATACCTGATTGGGGTTTCCAAGAGCTCTCTCTGAATGGCGAGAATCTCCAAACGTCTAGCCTAAGGTAGCGTAGCCGAACAAGTCCTCTCGCTTCTATCCGCCCCCTCCCAACGGTGGACTGAGGGAGGTATGTTCGACACAGAAAAAAGTTCTTCCCTTCACATGCAGCATCGGCAAATGCCGAGGCAGCAGGTATGCGGTACGTTAATGTGGGCATTAGAGCGGGTTAACGCAGATCGCACCTCCTTTAGGGAAGTGCGCTGGATAAGCCCCGCTAGTCGGATCGCCCTATCTGACTAAGCTCGGGGGACCATGTGTTCCGGGACTGACGTAGAGATATTGGAATCAACCACGATTACTGTCCAGACGCTATGTTTAGGCCACCAGTCCTAATTTGTTACAGTACTAGCTGCCGGTCCTGAGACAAGGAGTCTAGAGCGCCAAAGTTTAGCCCAACCTCCGGAGACGTTGGATGCCCCCATCCGAGGGTCTGATCAAGTATGAGGGAAGCAGCTAGTTCGCATCGGTGCGGCCAGTGGCCGACCCTCGGCGCACGGATAACACAGGAAGCACTCAGATCCTTCTGGATCATCGAAGAGGTGGGGTGGCCCCTTTCTTCTTTACTAGAGCTATGGCCCCTAGTACGGTATGTTAGGCTGTGGTGCAATTCCAGCCGGCTTGCAATCAGGCCTATTGACCGCATTTATGGGTGCAACCGGTTTCACCTGACGAAAACCCAAGGGGCGGTAGAATCCTCCTTACTGTAACAGAATGCGACTAAGATCGTACCCATCGAGGGGCTAGGATGACCGCCCCTATGCGGAATCGGCGCGGCAGCGGGAATTAAATGTTCCCGCAGTCCAGCCTTACAGTAAGCTAGTCGTCACTAGTCCCCACGCGGACCAAACACTAGCATTATGAGGTTGTGGCGCCACGTATATCCTAGCTGCCTAGAAGAATGGAGGGCCCCGGTAAGTGGAGGCATCTCATTTCTAGAAACGCGCCATAATATGGCAAATAGATGTATAGTTAGCGGGTCCTGGGGAGAGGTTGGTCCAAGGATTAATAGTCTCAAGTTAAAGGGTCGTTGTAGGGTTGCCCTACTGATACTAAGGTACCGAGGCCTGGGTGTTGCGTTTGCGACCTAAGGGTTAAGTGGTACGGGTATTTTATTTTCATCGCGATGTAACCTTTCGCCGTACTGCACGAACAAGCTTTTGACTGCGGAGTGCTGACGCCTGGCCAATTGTTGGCTGGTATATACGAGTTGTAGTGGGCCCTTATTTTACTCATGGTGCCGCTTGGATTCACAAAATTCTGAACCGGTCCTTAGCCGTCAGAGTGCATTTATATTTACGAGAGCGCATCATAACGCGCGATTCGATAAGGAGTGATCTACATGGAATCGGTCAGTACTCCTGTTCCTACTGCTAGATAATTAGCCGTAAGTTCACCATGGGAAAGATCCGCTAGGGTATCCGTCCCTTACTTTTGGTCGTCTCTTACATCCCTGTTGATGTGTCGTCGATTTGCGCCAAGATTCCATATCCAGAGAATTGACTGTGAACTGCAGTGTGCGTTCACGGGAGGACAATTATCAACACCTTGAAATATAGGGATGTGTTTGTTGGGACCTGAGCGGAAGGTATGTACGTTATGCTGACCCAGGGCCGTTAATCGTTTCCATATACGATTTTAGTACCTTGTTCGTCTATGTTGCCGTCCAATTTCCTCATAGCTTCAGTGGCTAGAAGCGCCATGACTACCGCTATTGAACCCTTGAAATAGAGAGGCCCGGCTCGAATTCCGACTGTGTAACCTTCGCCCTTAGCATGTCGGTCAGGCATGACGTTTAAGGTGTGGTAGGGAGTACAGCACTGACCCCTCAAAGCAGGCTCGGTCATATTCTTATGGCTCCGGTCTTCGGAATCGCTTCTTCCATACGCGAAGAGCCGTCTCCGGTTATGACCGCTGCCTGTTCATCATGGATGGTTAAGACCCTAACTTTCAATCGCATCACGGCATTAAGCCAGCGATCGGAACCGTCTGTGCCGAACCGATCTCTGACATGTAATCAGTGCCCCCCTCTCCGCGGCGAATAATTACTTACAAGCCTCGAACTTCTGTACTTGGCAGAAACTCACTATGACTATAATGGAAAAGGGCTCGCCCGCGTTCGGAGCGTCCAATGCCCGTCGTGGGGAAGCCAAGATCAAAATGGAGTCAATCGACGCCACGGGTTCCTTTCTCAGCACTGCACTGTGGGTAGCCCACGGTTGGGCATGCCCTATGGGATCCACACTAGACGTCTAGATCGAGCCAGGATTAACTGGAGCACGGCGTTACTGATAGGCATACCATGGCCCTGGGGCTGCCGAATTCGAACCGCTAGAACCGCGGTACGGGACGAAAGAAATGCTCTTGCCGAATGAACCAGACCATACTGTCGTTGTCAGAGATAAGCAGCGCTTCTGCTCACTATGCAATCCAATCTACATTACCTCCTCCTTCTCACAAATGCACGTACTTGCCGCGCCCTTTTAGGTCAGGGGCGCGCAGCCCTTGATAATAGTACAGCGGGCTGCGCCCAGTATGGGTTACTAGAAAATCTCTTAGAGCGCCATAGGCGCCGCTGCTAGCGCAGTAGCGCCGCGGGTCGGAGAATGAGTAGCGAGGTTATAGACAAAACACGCCGGCGCTGCGTAAAATATTCAGTACTAGCTGAATTGAGGCAGTTGGACGGGGCGCGGGCTCACTAGTTCGATAAAGGCAGGTACCCTAAAGCGAAGTTTGCTACTTGTTTACCTTTCTCCTGGTATCGTTAGCACTGCCATGTGAAAATGCCACGGTTGCCGGCCTCGCTGTCGTGCCCAATGTTTATCGTCTCGAACCAGTAATTGGGAGGTGGATAAAAAAGACTTGTGGCTCGCGACATTTGTTTAAACGACTCCGTTCTCAGTTCTCGCGGGAACGGAAGTATGGCTTATTTATACAGATCGTTCTAAGTGAGGATCTGACTCTTTAATTTCTGAACTTAAAAGTTGGGGTATACGCCCATAATGTTTAACAAGCAGATGCCCGCCGTGCGAGGAAATGATTCTTTTAGCATAGACGTCGCATCCCCCACCATGGGTCCCCACTAAGGGGATATGTTATGTCAGACTCATGGTGAGACAAGTATAACATTTGGGTAACCCGCTGTTTGAACGGGACAGGTAAACATCATAGGAAGGTTACTAAATTGTATGTTTGTGGGTGCGCTAGTGACAGTGGTTCTGTGTTGGACCTCCCGCCTTCATTGCCACTAGCCCAGAACTCCACAATACTTACAGCGCAGTCGTCTGGACGGCCGGGGCGACACAGAGACGTCGCGCGACAAGCTGACTGCTTCTTAATGGTACAAACCATGTCGTAGGAACAGTCAATGAACGCGACGATGGCGCTGCTGAAAAAGCGTCGTCATGTAATAAACGAATGCATATTACTAATAGACTCGGTTGGTGCGAGCTGCAGGCACTCGCCAACTCCCGTAGAGACCTTCTGGTACCCGCGATCACAAGGCAACAGCGTTTTTTAGGTTCGCGGCATGCGTGTAATATTTAATCTTAGTGCACTCAGGACGGGTGCTGAGAAGAGTGCCCAATACGCAAGATCCAATGATCCAATATGGAGCTGAATCCTTAGCGGTGAAATAAGAACAAGTACTTACACCCGAAATCAGTGCGGATGGTTGCGATAGGGCTCCGAGCTGACGAATCCGTGTTCTAGTTAGGTTGTAGAGCTCGCCAGGCAAGCAGAGGTAGTACTCACTACAGCTCCATCGTCCTTTCATCTTCTAACGGTGAGTGATTTCAGAGCAAGCCCGCATAACAGTGTTGAGATAATTCGCAAGTCAAGTCGTTTGGTCGCATAGGCATTGTGGTAGCTAGTTTACCAGCACCATACTTATAGTTGGTCGTTTGCCACTCAGTGGCGGGCTCAGTATCTGGACGTTATCTAGTCTCCTCCTTAGATTTCATGACTGGCCGGGGCTCCTTCCTATTGCGCCTTTGTATGTTTGCCCCCCGCAACATGCTAGTATTTTGTCGAGCATTTGAACTATCGGCTCCGTGACGGATTTAAGACGTCAGATGTCGCTACTGGGAGCCCAGGGGATTTGATGTGTCTGAGATTTACGGAACCAGCCACCGCAACCCACTATGATCCGCAGTAGCTCCGGCACAGGTCTTGGATACCTTCGGGAGGTGCCTTCAGTTCTGTTAGGATCAGTTTTATCGCCGAAGTGCTTCAAAGCTTTTACACGGACCGTGCTTCCATTTGGGCAACCTCTCTCACCGGAGCGTGCACGCTTAGCATTGCGTTCTGACGTAAGGCGCGGCCTACGTAGGATCGAACTGGGGTCATGATATGGGCACCGACGCAGTGTTGCGGATGAGCGAGTCAACGAGTCAGTCCTTGATTGATAACCATCAATCCAATTCGCTTATTTAGCGCTAACTAATCGCACGGGGTCGACTAATTTAGAGGAACTTGGTCCAAGTAAACCGTCAATGGTTTCTACGTGATGGCAACGTCTTAACTTCTCGCGAGAATAGTCGCTTCCAAACCTTCAGGATTAGAAACTCGCGCACTTACCGACACATGGCTCGCTGCCTTTTTACCACGCTTCGGCATTAAGGCACCAGTAGATATTTGAGCACTCTGGCGCAGGACGTCATCGTCGGTCTCCTCACATGACGTGCAGGGTTGGAAAAGTGGCTAATGCGAATCAGTACTTGCTGTTGCGGGGTAAAGCGACAGACCTTCCACGCGTGTCGTCTACCCCACCAGACCCTACTGAGATGTAGACCTAGCCATGTTCACCCTCAGATCAGTCATCGCCTTAGAGTCTGGATCTCTAGTATGAGTGCAGGAGGCTATCCAGAAGTTTGGGGTAAGTACGCGGCTCCCCTGCTATACCATCGACTTAGCGTTAGGGTTGAATACTACAACCCAGAGTTCCTCCCTCCGCTTAATTAGCCACCTCAAGTAAGTGTCAACTCCTCTAGCGGGTGACGGCACCCGAATGAGGCGGCCCTGAGAGAGTAACCAGAACTCGAGGCACGGGCAGGTGGTAGCCAACACTTACCCCTCATGTGAACTCGCCCAGGCCCCGGAAACAAATCGTGTTAAGGGGTTATGAGCGCCTATACGGTCGCTATGAGACTATAAGATGCTTGAAACGGATGTAAAACTGTTCGGTGAAATAGTATGTTGTCATGCAATCCGATTCTATGTCATTTTCGACTGTGTGGAGTAGTGATAACCGATCGATCAACGCGGTTGGCGTGTAAACTCTTTCTTTTCGGACCGCTGCTCTTTAGTATTTAACTTTGTAGAACGAGTGGTAACTTTCAGTGGTGATCGTTCCGGCATGTAGAGACAGGTCGTGCGAACTATCGTACGCATAGGTCCACAAGTTTCTTACCTAGAGATTCTCGCTTACAACAATAATGAACGCTTTGACTCCTTAATCAATACGCCCACGGACTGAGGAATGGAAATTTGGGCCCAGCGTTAGTATATGACCGGCTTCACGGTGCAGTGACTATTGCGCTGGGAGAGGCCCCCCTACGATTACCGATCCACCTGCGACTTTAGAGTTCATAAAGTACCGACAAGCGACGAAGTAGACGGGAAACTTGATCGGATGTCTACGATGCCAAAGTGATCCCCTGACGCTTACGCGGCCTAGGCTGTCTGACGTCGTAGCTTTCTTTCGTTTGTGTCGAAGGATAAGTGACAGATCTTCTGAGCTTCCACCAATAATGTTAGTGTGTTCATAGCCGCCGTTCCGGAGCCCTGACTTGAAGTATCTGGGTGGTTAATAAATTACACAAACCTAGTTAGCGCTGGTAGGTCGCGTCTCGTCTATCTCATTTCGTGACTGGCCTCAAGCTAGTTTAGCGCCTTTTGATGCAGTTAGAATTTGGTTGTGGTGGACTAGAGTTCTCTGCACAAATGCATTAATTTGGACGATTTTTTTGCATGTAGCTTAACCCCGGTCGTCGGTAGACACTGCAAAAAAGCGGTCGTAATTAGAACCTGCGCGGCTGTATTAGGCTCGGTATTCCTTGGCCTACGGTCTCAAAAATAAGGCGAATTAGGCGGCTGGTTCTGGGATCCGAGGACACTTTTTCTGTCTAAACCATCTACGCTTGGAGAAATGGCTCGTAGCGGACCATTCTAGGTGCTGACGAACTAACACAGTAACCTATTCTCGGTAACCGCTCGAAAAATCTAGGAGAACTTGCATAGTATTACTCCTAGGAACTTTACATTACAATACTGCGACCGCCTCTAAATATTGAAGGATTGCGAACACCCAGTCCCAGGGTTCTAACCAGTGTGCATCCTACGATGAGGGAGGCTATTATACGGTTTACAGCAAAGAGATCATGCAATGCGGTCTGCGAAGCACGATGTCACAGCAGACTCAGGCTCGACCAGCATGTAAGTTTCAGCAGTGAGACCGGTCATTCCTAAAGGGGGTTCGTAAAGGGGGCTCACGCTGTCTGTCCGGTGCAGAGCCTACTACCTGAGTGTATGCCTTAACTGACATCGTCCATTTACAGTTATGAAGCCCCCCTACGACCAAAGCCGATGGCTCAACAGGTACTCAAGGTACGAGTTATGTACCGTGCATGGATGAGCGATATCACCCCACATATTACCCGGTACGCGCGTCCTTGTGCACCTCCCCGCGCCAGAACCTAGAGATCAAATGTCATGGTATGAGCTCAGGCGGCCGATACGCGTAAGATTGGAGGTAGTCATGTCAACCCCATCTATGTAACCCCGAGTTAACGCCACCTATGATCTGCAGCACTTTATAGTTTCACCTCGTAGGAATAGACGGCGGTAAGTAAGGAGGGCTAGTGAGCGGCATCGAACGTGGCCTGCCTTAGGTCAAGAATAGCCGCTGTGGTCACTCTTGAATGTGCCCGGCCTGCCCTTGCACGAACATTACAGAGATCCTAACTGTAGCGCGACGTGGATCGCAGACCCTATAGTTGGAACCACGTTTTGGATATCGGCCTCGAAACCCAGATGTCTCCTCGGATGTTTGACCCGTTGATTAAGCCACCGACGCCAGACTCATACATACCCCGGTCTGTGCCCATATTGTACGAGAGTCGGCATTAAAAGACAAGGCCATGCAACTGAGACCGTTAACGGTGGATTATGTTAACAAGAATAGGTCCGTACTCCAGTGTCGAGGTGCGGTACCTACACCCCCTTATCCACTTGGCCAAGATCTCCGAGAGTACGCAAAGCGTACAACCCTACTAACCTCTGATCGGAGAGGCGTGCAAGTCTACCGTCTTTTTTCCTCGTAGGCGGATCAGGCTTGGGCAGGTTGATGGCGGGACATCTTTTCGGGACTCGCACATCGACTATGCCTTTGGAGTCCAACTTGTGGGAACGCTCGCCCGTGAACATGAATAGTCACATTTGTTCAGGCTGTTACCCCACACACCTATCATAAGGCGTCGATCGCACACTGAGTCCACCGCTCTAGTACCGATACTGATACTGCTTGTATGATCTTGTCGGCGTAAGTGAGTCTTGAAGCTACAGGTCATCCTCCACCGGGTACATGACACAAGGTCGTGTTCGCGACCCGTGGCCGTCTCCGCGCACACGCGTCGTAAACCACAGCGTGTTGGCCCCCAGTTGCACGAACCGGATTTAAGACCGCTCGTTACTACGTGCTAAGCGTCGTTGTCGTCTCGTCGTCTTTCACAGGACAAGCTAAGGTTGAGGGCTAGGCTTTGTCTACGCTCACAGACCAAACACTCAAAACATTGTACGCCCCCTTCCCTGCACTTCGGCTGAGACTAAGAATACATCACATAGCAACTCGTGAGACCAGTTGTTAGTTAGACTGCCATGGTCATCAACTTAAAGAGTACACGACACAGTATGCTTTCGCCAAACTACTCGCCGCTTTAAGTCGTCGATTGGTCTTTGGGGACATAGCCGGATAAGAAGTCAGCCGCCTTGCCTCCCATAACTCGCGTACTGTGTAAATTCCCGCAGGTCCCCAGACGGTTCTCATACATTCAGCGGCACTCCTAGAGTGCACGGCAAGAACGATTTATCAGAGCACAGTAATCCAGTAGTTTTCAACAGCAGAGCGGGTCTACGCCCAATCTCTGACCGAGGAAGCGTTTCCATGCGCTTCCAACCGCTAATCTTTCTATTTTTCTGAGTTTAGTCTTTCATTCGCACCTTAGAATATCATGGGACATGAACGGGTACTGGGAATTCTCTAAGGCTAGACCACCGACGGGTGCATCGAACACCAGTCAACCCCTACTTCCATTTTTTTAATATCAATTCATGTCAACGCGAGGCTTTTGGACACAGAATGGCGACCGCTTCCCCACGTATTGCCAGATACATTAGCCAGTCTCGACGACCAATCATGTTGAGGAGTCTACCTTGCGGGAATGCCTAATGGAAAACTCGTGCCCGACCGAACTGTTCTAAACCTCACACGAGGACCTCCCGGGTAATCTGTGATTTTTACCACTAACTATACACGGAGCATTTCGATCTTCAATGGCCGGCTTTTATGACTTGGCTCAAATGCCAACCTTACGCTCAACCAGAGAGCTTAAACCGGCTGAAAGTATGTACGATTAATCGGTACGTTTGATACGCAGCTAAAGCCGTCTAATCCACGGAGTATCGTTAAGACCCATTAGCACGTGTGCGCCTCTGAAGAGAATGGTTTATAGTTTCGTTTGAGCGCCAATACTGGTAGTATGGAAAACGTTGGATCACCGAGAATTTATACGATCCGATGCCTCTCGTTCTACGCCCTTTAGGAAAGGCTAACCATGGCAAATGCTATACGAACGCCAGGGGTGTCAAGCCAGCGCCATACAGAGATCTACTAATTGCTGGATCGCGCCATGTGAGATCGCGTTATGGGATCAGAGCGCATAGTACTTCGAAACGATCGCAGAGAGGACGTGGCCGTAGAGGGAGGTTATCGCTCGGTATTATCCCCAACCGCAGTGAGGAGTCAGCTTACCAAAGCGTTATAAACATGTTAGACAAAACGATCGGTACAAACATAACTGTAAGGTGTGTCCGAGTCGTGGGGACGGTGGCATATATGATAAATGAGACGTTTCAACCCAGAAGTATATATGCTTCTAACGTCATGCTGCATGCGGTCGGAAGCATGCGGCCAACTCAGTGAGTGGGGGATCCGCGTTCAACCGTTAGGTATGCTTCCTGGTAGATTACCGCAGGTTAGATGGCGTAAGCTGCAATGGGACCGATAGAAAGCCATTGGATGTGACACGCCGGTCTTGTCCGATTGGCTTATGCACACAACTGAAAGGCGGTGAGCTCTTAAAGCCTGATATAGAATCTTCTATAAGTTTGGCCGAACATATACAAGTGGGACTTTATAATGGAGTAGTCGATGTCCATTAGCCTAGCGTCCCGCTACTCCCAGGCCTCTAAACAGGGGCAGGTGCCAATCCTCGAGTGATAAGCACCCGCTTGAGCCATGTCCATATACAAGCCGTAGTCGAGGTAGTTGGCCCAAACCTTATGTCGCACCATTAGGTCGGCCTTGCGGGATAAAAGTCCCTGATTAAGGTTGTGCGAGAGTTTACAGTCCTGCTACTCAAGCAATTGCTCCCTAGTGTTCTGTGGGTTCCGGACCGCTATAAGATTATGATGTGTGAAGCGGAAGCTTAGTAACTCCTACACCCATTTGCCGTCTCGCTGTAGTGCACCCTTGAGGGTATAAGTTCGGACCGTGCGACGTTGTCAGACAAGTGCATAGTTCGCTGTCCCTTGAAACTTACCACGCACAGAGCACCCCTAACCAGGCAGAGCTGCAGATCACCTACCCTGCACCAAAAGAATCAGGCATCCGACTCGAGTATGGGGAAGTTGATAGGATTGTCACAGTCTCCGGGTAAGTTAGTGAGTCTGAGCACCCGTAGCGGGTGCGTTAAATGTATGTAGAGAGCTGCTGTGCGAGTCATCAGTCGTTAATCGATAGGAATTGAGCACCCAATATGGCCCGAGTGAGGTACTTCTACCGCGGAGCGGGGGTACGAGAGTCCTTTGCGACGAGGTGTAGGCATCTACTTTAAAACCATGAAGCAATTTGGTAGTTTATGCTTCTCTGAAAGTGATTTACGTCCGTCTGCGGGAGGCAGTTACATGTGAAGCTGGATTGTACGCCGTCTCGACCCCGTCGGGTTGTTTTGCCGTAACGGTAAATCCCAATAGAAGACCTTAGAATGGGAAGGGGTGTTCACGCTGACGCCGTCATCACCAGAGGGACCCACCACCGCTTTGGTTCCAATCATGAATGTACGAACGTATTCTAGCATCCTGGATCTACCTACAAGCAAGAGACGGGATGCCCGCGACTACGTACAGTCGATATTCTATAACGTACTTATGGCTTAAAGGGAGCGAACATTACCTCAGCCAAATTGTAGGTAACGGACGAGAGACGTCTGCTGGTATTTGAAGCATTGGACGTGTTGTTATGCTATGTAGCCAGTATACGATAAGCAGACTCCGCTCTAACTTAGTTGAAAATCTTCAGATGTATGACGTGCTAGAAACGCAGCGTGAGTAGTAGGTTCTCACACGTTACGTCGATCCTGACGTAAATTTTGCTAACAACGCTAACCAACGGCCTCCATGCTAGAATCTCTCTAAAATATGCTAACGACCATAATGATTGGTTTCAGTCGTTCCCTGCGCGAAAAATGCGCCGAACAGTGTGCGCGCAGTATTCACTTACATCGCACGAGTGGAATGACGCTCGGTCATCTACCGGTTCAGTCACTCCCAAAGCTTTGTAGTAAGTGTCATCGACTCGGACATCCTTCGGAGTTCGATGGGTATCAAGCGCTTTGCCACCCCCCCGACTGGAGTGGGAAGCCCCCAAGGATAGTTCTTAGCGCCCATTGATCCGGTGTAGTTAAAAAATCTCATCCGTCTCCAAGGCGCGGTCAGGCGCCCTACTACGTCTACTATCCGCAGTCCGGCCCGCGTTAATTGGTGATGGTCCTACATTCTGACAAGGGGGATATGTAATCCTTCTCCTGTACCCGGGACTAGACCCAGGAATGAACTAAAGAGCAACAGCGGTGGGTTCCGACGAGTGAATCATCGAAAGGGGGTCCTTCTGAGGACCTAAAACAAATTCCTTTGGGCTGGCGGAGTCAGCCATTCTCCATCTCACCGGGGGCTTTCTGATCGACTCGCCAGTTGTCGTCCGAACCTGAATGTAGTAGTCGGACAGGAACCTCCCCCACACGCCAAGCCTAGTAAGGGCGGTTACCCTTGGTATTTTGCAGGTGTAGCCGAAGAGGGTGACCCTCCCGCGGCGCATGTCCTGAGCACACTTGCAATGCGCTCCTGGGTGAGTTCGGCGTCTAAACTGTGTAGGCATCTGCTGTGTCAATACAAACTATGACCGCCTAGATTAGCGGATGAACCAGGAGAGAAATCATGAACTGAAACTGGAACGTTGCACCTGTTCCGGAATGCTGTGGCAGTGTCCGTTGGCAAAACTGAGTCGTACCCATCTGGTTCCTCGCCTCGTACCGTTGGGTTTGATGGTATAATGACAGACGTCGAAGCGGTCATAGGGACTCAGGAATTTGGGAGTGGTATCGGAGCCTCCAAGTAGGTGAACCATTACTCTTGCGCCGGCAAAGGTATCCCGTGGTTGCTCTATAATACTAACAATGAATAGCAGAATAGATTTAATCGGCTTTGATGGCCACTCCGATGACTTCCTATTGCCTAACAGGAATGAAGAATTGGTAGCCAATAGGCCAGGTGCACCGACGTATCAGACTTATGATATTGCCGGCATGGCAATGGGCCTCTGCCTTCACATGGCCTTAACTGATGCAGACTGATACTCTAGGTAACGCAAGATCTGGGCCCTAAACCCTGAGGCGTCACATAGCTCCCCTTATTCTCGCACAAGGAAATAAAGAGAGAGTGCTGGCAGTGGGCAGGCCCCAGCTTGGCTTAATATCTCATATCTGTCGCATGAAAGTCTTGCTTGTGCGCTGTAAGACACCAAGTAGCCCGAGGCGAAATAGCATATCTCTGATGGGGTTTCACGCGGGTAATAGGAACTTCTGTGTCTACTGTTGTCAACTGACCTTTTCGGGATGTTTGTAGCAGCGCATTGGCCTGGGCGCGAGTCATACGGCGTCTTGCGGCCTGCGTTCAACTGTGCCCAGGAGGGCTGCAGTATTTTTGCGACGAATAAGTCGCTCGCTGGTTGTCGGATGTCTGCCATCATGCAAAATCAGACGTGCGTGGTCGGGGCCCTGCGGATTGCAAGTTCTAATATGAGCTTAAGTCGATATGACCTCTCAGAACAGCGTAAAGCTTGCCTTAGTAAACCAAATAGATGGTGGAAATGTGACTCCACCTTGGGACTGTGTGGGGTATACTTCTATAAGACGGTGGCGCGTCTTGAGGGTTTCCGTTAGAAGGTAGCTGCGGGTTGTTACAAATTGATTTGGGCTCCGCATGGTGCGAGCCCACAAACGCTCCGGCGGGATCGGGAGCGCTTTCTAGTTCGTACCTCGCCTTCAACTGACTGAGGGAGAACCGCGCGGAGAGCCCGTACTCGATGACGTCTGATAAACAAGCTTCGGGAATAGCGCTCCCGCCCGAAGGTTACCATTGGTTCCTGCGTAACTATTTAAGGCAGCGCTGAATTCTGAAGTCTAAGACCTTGAAATTCGGTTATAGTTACCCAAATCCCACCCTAAGTGAGTGGCCGAAAATGGTTCTTCCAGTTCTGGGACGTCAAGATCGTTGCCCGGATATATACGTTTGATTGGGCCGATGATCCCCGGACGTCGGGATCCTTAGGCTGTTCCGCGACGACCGCTCTGTTAGTGCTTAGTCCGGCGCCCAGTATGCCTGTCTGCTTGAACTACTACCAACCGGATCCGCTTCGTGCTATTGTTTTATAGGCCATCTTATGTAATTCCGTAGGCGTAGAGAGTTTCGACCACGATCCTTATTGTGACACTTTACGTATGGAATCGTGCTACAACTTTAGCGCCCGGAGGATCAAAAAAGGGCACCCCCATCCGTGCTGACAGACACCATAGCCACGGGTACCTTCATTACGAACCCTTGTCTTAGTATGGTGGCAATTTAGCACACACCTCGCTGGGCCCCAAGGCGGTCTTACGATACTAGCGAGAGTCCAAAGAACCCCCGCAGTTATGTTTTACTTGAAGTTCGGGACCGGTCCGAAAGGCCGGTGAATATCATCGGCACAGTTGTAAATGGGTTACTCGGTCTAGATCATTTAACAGTCTCGGTTGCTAAACTCTTCAGATACCACGCAACGGTTTGCCAGACGTTTAAACAAAACGATAACGTATGCCCAAAGTGGGTTGGCCGCTCCATTCCAGCCCATATAAAGCATGCTGTCACTGTGAGCACCTCAGTCATGAGAGTAGTAGGCCTTCGCGTCTAGCGAAACTCGACTCGCACCCGACGGCAATTCCGTATGCGTTATGCTTCCCGCATGGTTACACTCTAACCGACCTAAAACGCTCTATCAGGAGCGGTTATGAATTCTTCTTGGTAGTCATGCTACGGCTGCAGGGGGCGGGATCTATCCAATCGGCACTCCGATCAGTCGTTCACTAGTCAAGCATCTCCCGTCTGCTCATTGTTGAATTCACAGCCTTTGATCCTAACTTCCATTCTTTACGGAACTTGCGTTGGTTGACAGGCGAGTTGGCACCGGCATTACCATCAATAGCTTTGAGTTCAGTACAATTGCGACATGTTGCACTAGTGGCCGTAGCTATTTTTAGTTTGGTCATCCAGTCGATCTTATACAGCTAGGACGCCGGAAGGACGGGAAACCCCGTAATTGCACCAGGAGCGGCCCGCACGGCGCTATTAACCCGAATTGAATTGCCTTTCACAGAAAATGGGTCCTGGAGTGGTTTAGGAGATCACCTATAATTTCGTATTCTCTATACAGCTAAGCTGGATCCCGCGCCCTAGGATTCTAATATGTTTGCCCAAGACCAGTCCTGTGGAGGTATAGCTGGCAAAATCCAGTTCCTACGATCAGAATATACTTAAAACTACGTAAATCTACGGATACACTCTCTTTAACTTCTTCGGTAATTAACAGCTAAGGCCTTGGCACCGAGATCGTCGTACCGGTCACATCGTCTTGGTACGATTGGCTATGGCTTAGGAGCAGAAATCTTTGGGAACCCCACAGGCCGTTCGAGTTACCTTATGAACCTGATCTAGGTAGGGGCAGACCTGTTCGGAGTTGCTCCGTGTCCGCAACGACCGCCACTTCCTGATCCCGATTATTTCCGTCCAAGCGACTCATCAGTTAGGTGGGGCAAGTGAATTTTTGCTGCCCCTCTCTGGCACGACGTGTACATAGGAGAATGAAAGTGTCGTTAACACCCCCTGCCATGGGCCTAGTGCAGACCATATCCCCCTATTACATCATGCCTTTCGAACAACCTGGCTAGAAATACCACGAAAAATACTAATACCGGAGTGTTATCCACCCTAATTCAGATCTGGCGTGCTATACCCATCGTTAATTATAGGCGTAGCAGTGGTTTAGATTGAGTATGCTTATTTTACGGGTAAAAGGTCACTCCCACCCCACTCCCGACACATATTAGGGAAATGGCGTAACTTCAGTTACCGCTCGTGAGGAAACCGTGTCTTCCAGGCTTAAGACTACTTTGCTACTCATGAGGTCGTATGAACCCAGATTAAAAGCGGATAATTGCTCCGTAGGTTTGGTACACGACACGGCGCGGCTTAGGGTTGATTGTGCTCTCGGATGGCCGAGGTGGCCTCTGATCGAATATGGGACTAATAGGAATATTTATATGGTGTGCTATTTTTCAATATGTAAGCGCTAAAATAGGTCGTTGACCGTAGTGTGTAAAACTTCGTCCCCCTTGAGTATCGCAGCCGGTAGAGCACTCCTTGATATCAGCTTACCGGAATTAAGAAGCCCGGTCTAAGGCTCTTGTTCTCCCGCAGCATAACCAAGGTACGTACCCATGTCCGGCATCGAGATTCGCAGTGAAATCAGTCTCAGACGGAGATGGGATTTGGCCCGACTCGGATCTGAGAATATACGTCTTGGGACTGTTCCGCTACACAGACTAGGTTCGATCAGAAAGGTAGCGAATCTTTTGGAGGCCTCGGCAAGCCTGAATGTGCACGGTTAGAATGGTGCATGAAGTGCTGAAGGGGGGACTAACATAACAGCGCCTATCATAGCGCTACCGAAGCGTCGCGCATTCCAACTAACGGCATGCGCCACAACCCATGGAAGTGCGATTCATGCGACTACTCGGGTCCGTCACAGATAATAGTCTAATACATCATGACCGGTACGCAAGCATTGCTTGTTAGCTTATGTCGCACGTTACGTAAATTCAGAAGAAGACGGGGAATACGCTCAGCTTCTCGCGTATATAGTGACGGTGTAGCAGTTCCGGCTCGGTGGGCCCGGCTGCCGCGGCGGGTTACCAAGGAGGCTAGTAAACCGAGTCCAACCAGGACTGTTAAGATTTGTGCGCCCTTTTTTTTGTTTTCAGGAGACTCTATCGACTTCTCAAAGGACTTAGAGTTTGCCTTCGCCGAAAGTTGGTAATCGCTTAGTGGACCGGGTAAGAGAATTACGAGTAAGAGAGAAGTATTGGACCGATACCACTCTCACATCCATTTCTGTAGGGGACTTGCGACTCCTGTCATGCTCTTAGCCGGTTAATGCGAAAGCCCCCCTAAGGTGTCGTAACTGGTTGCGGAATCGTCGTTGGCAGCCAGTAAAACCCCCTCCGGCGTCAAGATTCTCTCCGGTACTATCAATTTCGAACGTAGTTTCGGTCCGCCCCACACCTAGCCTTTATTCCGTTTCATATCCGGGGTCGCTATATACCCGAAATTTCAACAGAAACGATTGTGCGCAAGGATCTTATAGGGACCAACGTCAGCTAGTTATAGTGCAGTGGCTGTCTTGTTCTGGGTCCTAACTCAATAGCTCGGATAAATAGATCGTACCACCGCAGGCGCTGGCTCGCGGCGGCCGCCCATCTTGGGTACGCGACATTCTGAGTGCAATACAAGGCCTGCTGCCCGCACCACAGCCGACACCGCTAACCCGAAGGTTTCGCCCTTGGGAGCGAGCCAACCAAGGACGAGCTTTGAAGGAAGACGCTCGTGGTGTTTAGCGCAGACATTACTTTACTAGATGTCATACTACTGGCTTGCCCAGTGCCTACTCCATATCCGCGCACCCGGACTGCTCAAAGTGCAGTACGGGTATATATCGATGCATAGTAGATTCTGTCGAATACCTGCCTGCTACGGTGCCGAACGCTGGAATAATGTGCCCTCCAGAGCCCTCTCGGAGTCATATCGCGACTCACATAACAATTTAGGGGATTAGGACCATGGTACTACTCACGGAGGCCCAGATCGAGTCTCCACGGTGGGGTGATTTAAAATGTCCATAAATCTACCTACGTGTGCCCAAACATAAGGGATCGGTAGAATAAGTCTGAACTTCAGGTCATACTGTTCGGCGCGCCTTCCTGGAACACGTGTGGTACTGTTCAGGAGTCCGCTGCCTGAGGTGGCTAAGCAATATTAGGAGATTTACCTCCGGTCGCCAAGTACTTTCGGCATTAGCCGGAAAGGATCCTTCAACAATCAATGTTGCAATCAATTTAAGATGCTTCTTCTTGGTCTGTCGTCCCCCACACTAGAACGCGTGAAACACAACTAGTACTCACGATGAGTCAAAGGCATGTTAATTTAACGGCAGACGATGGGCACGCTAGACAAGTCGTGCCATCTGAAGGTGGGATAGATTCACGCTTTAGGGCTGGGTCGCGACACAGAAGTATTGCGGCTTCCTTTCTCACGCAACTTGTTTGGTCTCACCATATCGTCTACTCGGAACATGTCGGAATTGAGCAGGGTATCCTGTAGCCCGAATGGGATAGGCCTTTCGCGGGTCAGATAGGGCTCTGGAAAACACGGCCCGGGGGGATACGGATGCCAAGTTCCTAAATCCTGGTAAGCGAATAGCCTTAGGACTGGAACCAAGTGATGCTCACTCGAAACGTCCAAGCAATGAGGCCCGCGTTGCATGCTAGACTGCAATCATGAGCCTTCTTAGGTCGCTGGTTTCGTTCTATGCCTACCTGGATTAGGACATCCTCTGATAAGTTATGACTATGGCTTTTACCGACACTATTAAAACTGCCCTCGACGTTCTAATAGATGGATAGTTGTTCTTTTGCCCCCCTTGCTTCCAGAGTTTAGCTGTTATGCCGTACTGACGTCTGTTCGACTTTAACTTATGAACCAGGTTTCCGACCCTTGGGCCCCGGCGTACATGTAGTAATTCTCTGTACTATAGATGGCGCCGAAGCGCTACCAATGTCTACATCTTCCAGGGGACTCGATGCACCATGCATGGTGATAGAGTCCATCCATAGCGCAGATAGATCGGGGACCCTCATTTTAGGAACCGCATGCTTGCGGCCGGGAATCACGCACGGCCGAGTGCACTATCGTTTCAACCCTCGACAGCGCGTCAGCTACGTGAATATATGTGGACTAGGGAATAGACTGGGAGTGGTAGAACATCATGAACCACCGATTGAGATTCTGAAGTTCGGCCGGTTTGACTAGAGTAATGCTGTCGTTTGGTTCATTGTTTTCGCTTATGGGAGCGTATTCTAAGTCCGTGCCCACAGCGAGGATGGCCAAAAGAGCTAATAACGGAGGTCAATCACCAAAATCTTTTTGATAAGTCAAAAACAATCTATGCTCGTGGATGAGAGCTGGGCGGAATTGCTACGGCAACCGGATTCCATCCCCTACAACTCAGACTAGAGAAGTCGCGATTCAAGGACTGGGTTATCGTAGGGGTTTGTAGGAGTACATAGGGATCGTTGTACAATATATCGCCTCCCCGTATTTCTCTTGATGTAGTTTCCACACCCCCATAAAAAGGTGTGCTGTTGGCGGGCGTATACCTACTATACGGAAGTTCAGTGACCTTTAATGCTCCACTGTTCTCGTCATTAACCGGCAGCGTCCCCGCGGGTTGAAATGACCCTTCTGCCCAAGTTCTTTACTAATTATTTCGTCTTGCTGGGGTGGAAAGTCTCCTCGGAAAGGTCGTTTCTGCCGCGATCTGTGTTAGAGAACTAGTCCCCCTTGCAGCATACAAATACGATCAACAAAGCGTCCACCAGCCCGTCGTCCATTCATCATCCGGTGACCTTACTTTGTAGCACGATTCGCTGGTGGTTTCGGGTTTGCCTCAGGGTGTCTCATAGTTGGGATTTATCCTAAAGTGGGACCCGCAAACCAACTACGCCTTTAGCAACTAACTGCGGACCACGCGATTTGTAGGCATAATAGACTCTGAACAGTCCAGACGTAGATAGGCGCAATCCGGGCCGCCTTTCATGGTCTTCTTGTTCGCCCGCTATGGTACGGAATACGTGGTGCAGCTAATGGCTATTAGTTAAGACCGCTTGGTGTCATTTGCTATCAGACCGGCGAACAATGGGAACTTTGGCCTGGTCGCGTCGAGCAGTTCCTGCAACACCGCTCAGCTTCCCACTTTGCAGATTTAGACCGTCTCAACGCTGCGAAAACGCGAACTATCCAGGGAGAACACTATTGGGTCGATGCTTAGGCGGGCCTGGTATCCCCCAGGGTCATGTTACAGTCAAATTGCCTCCATAACGATCGTCCGCAACGTCCCTGATCACGACTAGAACTTATCGAACACATGGTACACTAATAACAAACCCCACAGGTTTAGCGACAAATCTTCGCAGTAGGTCCTAGATCGCAACGAGGGCGTTAATCGTGTTTCGGCCAACATACCTACAATTCTAGGGGTAGAGACATCGCACTGTAATGACTCGATCAGGATTCAGCAGTGGAGTTGGGGAATTTTCGAGAGTATGCCCTAGACAGTAGGGTAACTTCGTAGCCAATCACGCGCCGGCCCACAACGCAATGTTCCACCCAGGATATATTTTTTAGGAGTTTTCCTGAAAGGAGTTGCACGCCCAGCTTTAATGACCCGTGAGGTGATGAATAAGGGGGGAGAGGGTGGGGGTTACGCAATGCAGCTTTTTTATCTATTACCGGATGAGTGACAGTACACTAACTTCTAGTCGGGAGGCGAACGTTGATCCTAACCACTTTACTCCATCTCGAGCACATCTGTGACGCCTTATGCGGCGTGAAATGCTCGCGTCGTTTAGGTGGCCAAGAGAACACGGTTACGTTAACTCCTAGCGCGGTTGGATACGTGGTGTCACAGACAAGAGTTCCGGTATAGTTAAGTTCAAGCTGATGCTTTGACCAAAAACAAACGCCGGATCGAGGAACCTGAACCGTCGCTTTCTAGTTACCCTGTCCCTTACGGTTGTCGCGCTGGTTAACAATTAAAACGGGACATCATTACGTCCGTAGCGATTCTAACTACGTGCGTCCACATCAGGGACTTACTGCCCATCCGATCAACAGGAGGGTTAGTAGGGCAAGGATTCTAGTTAAGTGAACTCCATCTGACGTATACTAGCCACATCGAGATCCGGTTCTTTCCTTATTAGAGACGAGTTTAAGCGCCCGCGGTCTACTGGAGCTATACCAAGATGACATATTAGCATGACTAAACCTGTACAGCTGTGCCAACGCCCAATTTCCCAACACGTGATAATTCTACCCTTTTTGTACGCGATTCGGATGAAAACAAGGTGTATGCGCCTACTTGTTGGTAAGAAAAGTAGAATATACAGGCATACATTGAGCTAGAACGGTTTATAACTCCTATGAGCGCTGCCGGCGAATCTCTCAACATTAGGCACATCATCCTATGAAGGGGTTCACAGTCTACACTGCACCCGAAAAAGGCCAAAGAGAAGATAGCTACCAATCACGTGGACGGCCCCCATATCAGGTCAGTTCTTCTACCCTTGGGCCGGCCGTGTCGTCTATAGTGCCACTAAAGTGGGAATCGCACAGTCCAGTGGTCCCCTGATGCGCCCTAACGATTGGCACCTGCTCTACGACGAAGCGCATAGTTGGCGCGTATCACGGGGCCGGGCAAGCTCAAGGGAGCAAGTACCCAGGAGACCAGCGTGATACCCGGTGGCGCTAGGGATCGTACAACGAATCCATGTCTGGAAAAGAGCCTGATTAATGGAACACAAAAGTGTGACACGTGGGTTTCTCAGGCTGGCCAGCCAGGAGATGGCGTGAATACGTCCATCTTCAGACTACCAGTTCTCCGCCGCATCCGGACTATGTCGGGGTAACATTACCTCTGGTGTGGGTTTCACAGGGAATAAGAAATCTTGCCGGTCTCGGTGTACCCCACTCGAGCTATTCCCAAAGTAGCTTACGTCGGTACTGCCGATGAACTAGCACATCTAGTGTGCCGTCATCCCGAACACGTTCTGACGTGGGGTAATACTGTGGATCGGCCGATTGGAACACTCGCCGCTCACATTCAATGCTCAAAAGGCGGCCACGCGCTAATGGAGGCGCCATCCTTAACGACTCCTCCATTCCTGGGGTTAATTAGGCAAGAATTAAACTACTCCGAGTTATAAGTGGCTAGATGAGCGACGTCTCCGCCTTAACAGCCGGTGCTCTGTGAAGTATTGGGACACCCCCATCTGTTCCATATTATTTTCAGTGTTAAAATCAACATTGCTCACAGCAGCAGTACCAGCGAGCAGTCTGCCAGCACCCTTCTAATCAGTACGTAGACAGGTCCAAATTGTCGAGGGAGAAACCAGCTGCTTGAACGTCTTAATCAGTGAGATGGGAGTCCACGAGGTTCTCCCGGAGTCGGTAACCTGTCTCCTATACCTTCGAGCTGTCTTGCCCAAATCGGTAAACGTCTCGGACTGTCCTATCTTTCGGATTGTCTCGATTTGTTTCTGTAATTTGACTTTATCGACTATGGCAGTTAGCGTAAGAGGGGGACCCCCATGTTCATCATCGGCGACACAGGAACTAATTTCCGCTAGCTGACAACATCCCGATCGGGATCTAATTCGACCCGGTAAAGAGCACCGCTCTAGCTCCTGCGGGATCTACGCGACGCGGGAAGTCGCTAGTATGGTATAAGTGGGCGTCGAGGACACTCTGCCTGCGCCGACCCCTGGGGTTAACACGTTAAGGGGGGTGTGATGGTTCACCAAGAAGGCCGTGATGGGGATGTATCCGGGCTCACGGAGTTAGGGAACCCTCTTGTCACTTCGCACGTAGGAAGTAGCCAACCCCGCCCATAACCTCACGCCACTATAGCCTCCTCCGTCGGTGCATCACCTCACCTCGGGATTCTCGGCTTTGACAATGAGATCGGTAAGCTCTTCCGAGGCATTTGCCTCTTCCACGATGCGTGTTCTAATGGTTGAACTGTTTACTTAGAGATTCGGTGGCTGCCAAGTACAGTGTAATCGCTTCTACGCGTCTGGATAAATTTACGCCCCGCCACTGAATTAACCGTACAAACTCCCAGGAGGTCTACCCCTCCATGTAGTTGATCCCGATCACAATATGTGCTATTGCGCAACCATTTAAAGATCACCTAGAATTATACAAACCAACGCCGACGGTTTAGGTGATGCGACCACGACGGTTACACTATGCCAATCGCTGAAATCTCATGGTCGTTTACGTATCAGCATTCACCGGTAATCAACACAGGCTACTCCGACTGGCAAATAATGCGTAGGGTAGAGCGGCATTGTTTCTAGTAGCCCCTGGTGGACAGCAGAAGCAGCGCGCTGCGGCGTGACCGATGCGACACTATCACCTAGGGGATACTACGTCGAATTCCGGTTCCGGTAGCACTGCCGGAGCAGTTGCCCTGCAAGCGAAACACACCAAAGAATCGGCGTTAATTGCCCTCCTGTTGAATATGACTCGGGGGAGGGGGACAATCCGTTCCGCAAGGGGCACACCCTCGTGATCCCTGAGGCGGTCTTACCACAGGGGATATTGGACTGTAGTCGCGAATCGGTTTCAAGTCCCTATGAAAACGCCGTACTCTCGTTTTACGAACCGCCCTTGTCCATCGCTGACGTCGTCGTGCCCAGTAGCAGCCTTAACATATGTTATAGGATGACCACGTCCAGAGACTGTCGTAGCCGGATGCATGCGCATTATGTATAGTTAACACGGCCCCTACTCCAACGTGCGACAGGTTTGACACAAAGGTCGACGCCAGAAGTAACTCCTCTAAATGCGATTACCCATAGGCCATCCTGACCGGAAATACACACCATTGGATCATTAACTACCGAAAAGGGAGATCTCTGATTACTTAGTTCTGGCCCTCGCATTGTCCATGCTGGTCTGGAAGGAAGGGCTGATAACTAGGCAATCCACTAACAAATGAAACGATAGTGGCATGATTTTATCTCGACGGTAATGCAGTCCTTCTATCATCGGATACTCTGTGTAACTCTCAGCCAATCACCTTGACTGAGCCTGCAGCATTGATCCACGAGACTTTTCCAAACTGACAATCAGCACGTACTTCAATCTCATAGATACTGATTACGCGCGGTATATTAGTAACACGTAGTTGATAGCAACGATTAAGGCGCGGGACATAAAGTATTGATCGAGATAAGAAGGGAGTTATCATCGATATTAGTAAGTACGGAGCCCACGATTAGCACAACGCATCGTTACGACCATCGTGCTTTTCCTCCGGGCAAACCCTTCTTACGTTTAGACGTCGATCTGGTCCGTTCAAACACTCCTGCCTTCAATCCATGGAGCGCCTGGGCCTAAGCTGATCGCTCGTTGCATGTGGTCCGCTTGCCGGCGCCTGCATGAGACTTCAATTTTAACCACGGCCCGCGCGGCGCCGCAGGATTAAAGCATCCCCAGTCGGTGAGACTAATGCGGTGAGGTCTAGAGTAATTTAAGGTTTGACCTTTATCTCGAAGTTGTTTCGAGAAACTTACCACTATGCCGTCACTCTGTTGAGTATTTAAGACTCGCTGTCCGTTGATGCGATGGCACGGTAGCATCCCCAGGACCTTCGCACTCAAAATTCGCGTGTATCATAAACCACTCTATAAGGGGACCGGACAATGGGTGACTGTGTCAGCTTACGGGTGCGAGTTGGTGCTTATCTGATCAAGAGCTAGAACGGTACTTATGGAGAACGCTTAGCTTGCACAGACGAATCTCAGAAACTCGGACCTAGGGGGCTCTGATTATCTTCTCCGCATCTTTTGCAACATAATTATATTCTGGCCACCTACCCGTGTCACATTCTCCACTAATGATTTGCACTCGGTGTCGCAACCATCTGGTTGACACGCCTCGGTAATCCTAATCGCGCAGATAGGTCGAGCGCTCGAATGCGATGTCTGATTTCGACTAATAATGTAGTATAAATCTGGTACATGGGTTTCCAAACAGTGGTTTTACACCTGATATTGTCGCTTTTCGTCATCCGGGGGAACCATGTATGGAATTCATGCATATCGGTATGCTGGTTCGTTCTAATCGGTATTGTGAGAAATCGTTTATGTGCACCTTAGCTTGATTAACAAACAGATCCCAGAGGAAAGATTTTTATTCTTGGCTGAGCAGGAGATGTTTTAAGTATATCAATCACCAGACCTGGGACTGAAGCGCCTGCTACTTCTGGCTGTCGATCACCTTGTGACCTTGAGTGTCGTAAGTCGACTGAGGAGCGATCCGCCCCACCATAGGGTCATTCCCAGTAGCGAGGCGCTGACTCACTATGGAGGGCTGGGTACTGGCCAACCGACACCCAGGGTTCAGGCCTCTCTGTGATTACGAAGCTGGCTTGATTTGCGGTCACTTTCTGCCACAACTCAAAGGTCTCAAACGAGTTGAGTCACTTAGCGTCTTCCGTGCGACCATGGAGAGTCGTTTCGAGCACCTACTAGATGGCCATTGAATCCGCGTCGGAAATTGCCGGCTTGACGACGCGACTGGCCGCGGCAGCAGCTTTAGTTAAAGTCTGAAGCAGCTATCCGCTAGTTCTGGAGTGTAGATTAGCGATTATTGGTATTATCTCCGCCAAGATAATACCTCACTCACACGCCCTTCCCAGCAGGTTGCCAAAACCACCAAACTGTCACGTGTCCCTAAACACGGGGTCTATTTAGGAAAACTAGTGAAAGGACACTGTTTCTTTTACCGGTTAGTAATTTCCGTGTTTAGATTCGGCATATGATTATAGGGACAGCCAAAGCCGGTCCCGCACTTAAACCTCATTGATACTCAACCGTATCACACATAGTGAGTCCATACAGAGACCCGCCCAACCTCCCGCCTAGACTGTTGCTTATGCCATAAGCTATTCCACACTGTAGGCTGACTTCGTACGACCGTCAGCAATGTACCCCCAACTTTCGTGCGGTAAAGTCACTCCGTCGTCGCCAACAGACCTCCAGCCCTTTCCATACTCATCTTAAACGCCCCTCTAACATCTAATGCGTGAAGAGTGTCCTGAATCTCGCTGACGGGACAGCCTTCATCCACAGTCGTTACGCAGTCAGATGTCACGCCCTTGCTGTGGAGGGCTTTCTTCCTCGAATGACAATTGGAAAACATCGCGGCTATTCCTTTTGAGTCCTACTTCCCCCCGCGAGGTCAGGGAAAGGGATATCCTGGGCCGTATGCAGTTCAGGTTGGACATATGGACGAAACGTCGTAGTACTAAAGGTAATTGGGGCCCACAGTTTCAGGACATTCGTCTAGGTCGACATCCGCGTCAGAGTAGGTTCTGCCAGTGTCAAATACGTCGAGCGGTTCAGTCGAACACCTGGTGAAGCGTGCACCATAGTTAAACGTTGATGATCTACAGCTTTCCTCGTACGGTATAGCTATGCAGCGCGACCTACATGCTAACAGAGGGCCGTATAAGATACCCGACATGTGCAGTTAATGAGTTTGACGGCACGGATTAGCCTTCTGCGTGGTAGACCGTAGATGCAGAATGTGGCGGATCCGATGTTTTTTATCCCTCTCGTAAGCACCCATTTGATGACAGGATCAGAAACCATTTCCACGGCAAAAGCGCGGAATGTATTGTTGGAAACTGATCTCTAGCCCCTCAATTTTCTGGCTTGGCATGAAGGGGCATCAGGATTGAGTAAAACATCAGATTATCTTGGACTTAAAGAGAGACCTAGCACAACAGCCTACCGATTCTGTTTTGGAGGCGAACCTACGGGGCTAGAACGGGAGGTCTCAGCCCTCTATCGCATCATTGGCGCGGCGTACCACATTTTCCCGCATTAAATCTGAATTGCTACAAAACCTGAGCCAGTCTTAACGTGCCACCGCCGCATGCTGCGCGACTCCTATATACAGGGCCCGTGAGGGTGCTGCGCTTGGAAGCTTCATTCACCAAGCAACTCACGCCTCCGATGTGCTCCCGCCCTTCGTTAAATCCGATGTTCACATCATCACGTGAATATATTTATGATTTTCCACAGCGTTAAAGCTTAACTATGTTCCTCTGCGAGCACAAATACTGTGAGGCCTCAATCCCGGAGCTCTTAATGAGCGGATTTTAGCCGAAGACCTCTCCGATTGCCCAGCCACCCTCAGAGCTGAGCGAGTTTAGACCTTCTCCAGACCTCCATGATTGCCCGCAGCCGGGAGGGTGCTTACTGCGTGTTACTACATTCAGACATTACGTTGTACAAAGATTTGGCGCCAGAACGGTCCTTTTGACTCACCAGACTTTGATCCGCGCACTATCTCACCTCCCATGTATCAAGTAAGTAACAGAAGCTATTAATAATGCCTAGTATGTGTTTATTTGATCTCATTATTCAGAACTGCCGAGAGAACCGAATGATGTATCTAGGTTTAGTACCGGAGCTAGTCGTATTAGGTGTGTTATATCGACGTCGTCATTCGTACACTTTACAGTAAACGTCGGCTTAGGTGTTAGATTGGCACGGCGTCGATACGGTGCCAGAGCAAAAGAATGGGCTCACGGCTTTTAAGAACCCGAAGCGAACTGAACTTGGGACAGAAGCGGCCCGAGTGCGAAGACTCTAGATCGTTCGGAACTAGTTACTGCTACTACCATACAGGCTTATTCATAAGTAGGTGCGGGCAGAACGAACAATTCTGTATTACTGGAATAGGTCGGCTTTCGTCCGGCCAGACTACCTGATAAGTCTGCCTACTAGTGGGGGTTAAGCCAATTTAGAGGCGGCTGACATAGATAACATTTCAGTGTCTCTGCGATACTATCTACCTTAGAACAAGCGCAGACGCAGAACAAGAGAACATCCAAGGCTGCTAACCAACTATCTCACGATCTGCTCATTCTAAGAGCACCCCGAAAAGGTCAAGAGACAAAGCCACTTACACGCCCGTTAATAGCTACACTGCCTGCCCACCTTCACGTGTTGTCCTACGAAGACGTCGACGGTGCTACAGTTTTTGAGCCCAAATTCTGCTCTACAGACTCCATGTGTTTTTTTAGCAAGACGCACATGTAAGTGACGTAAAGCTACGGAAAGATGATACAATAGGTTCGCTTGTCTGGTAAAAGCGTTAGACTAACCCACATTTAAGAATTTGGCATCGTTGAAGGAGTTAAGGGTAAGTGCGTATAGCCCGTGGTAATGTATCATACTACCATAGCTCTCTACAATCTCATTTGCTGGTGTCGTGTACGGATGGTTAAACCCCCTGAATTGGGATGTCACTAGTTCCAATTCCACCGCACGCGGTCTTCCACCCGGTCTTTGACCTTCTCCAACTACAACGAGATAATTGCGAGTGTAAATGACACCTATTGAGAGATGACCACGAGGCATAAAAGGACTGTAAGCCCGATCGTCGACGCCCAATGCCGTTGGGAACAACCCTGGACAATCGGCTATGCGGCTTCAGCAGGGTCTATTAGGAGCGGGGCCAAAATATTGCATTTACGTCGAAGAAATAGCTTAATTGGAACGCCTACGTAAACACCCGAATCACAGAACGTGAATCGGGGACCGGAGCCAGTTAGGCCCGCCCTAGGTGACGGGGGTTTGCAGAATACGTAGCGCCGGGTTTAGTGTATAGGTAGCTCACAGGAAAGTTCAGCCTCAATTCATGAAAGACACTAAGGTAGTCTGCCAGCGGCGATAGAGAGAGGATGGAACCCGGCGCCAACCTTCGTTTCTCTATTGTAGGCCTCTGTCTTGAAGGTATAGGTCCTTTGGGATAGTGACTAGACCACCGCCAGCCGTGCCCTCCGTGTGAAAATAATGGAATTTCTCGACTATCACTCTCGAACGGACTAATCTGGACGGGATCATAACGATGAAAACCTAGAGTCAAAGCGCCGTTCTGGAAGTTCTCCATCTAGCAATAACACATGCGTATCGTGGGCACTCTCTGAATCACATTTGTAGGCATATGAATTCTTTCTGCGGTGCTGCCACCTGGCAAGTCCATGCGCTATGATTGCCGCTTAGCTCATTTATAGTCCATGTGAGTGCTTACGAGGTGGTCGGTGCTCCCTTCGTACGTCGGTGGGGTCGGCCGAGACTGATTACGAGCCCGATTGATATCGAGGAAGACAATCGAAAGGGTCCGAAGCGATAAGGGAGGTTGACCAAAGCCCAGTACTAAGTGATTCCGACGAGGATGTGTTCGCGATTTGAGGTGGGCCTAGGAACTGCTGAATAGGTTAGGCTAGAACAAAACTAATTACCAGCTGCGTATTGGTTATTAATGCCATCGTTATCGAGCAGAGCTCCCCTACGTGTGCGGGTATGACGTCTTCCTTTAAGGCAGTAACTCGATGTAGTCTCGTGCAATTGACGTTCGAATCACGGGTTGTGAATCCCAACCCTCACTCTGAAAGCTAAGCGGAGGACATCGAGACTCCCCGCTGTTCGCATTGATGTCCCCATTCAATGCTAGCACATTGAAGGTTACCCTACCCATGCCAAAGAGTATGATCAAGTTACCCTACGCGTCCGTTCAGAAAGGCGACTGCAAGTAATTCGTGGGATCCACTTTACAGACTAGGCTATATATAGAACCTTTCCGGACAGATCTCCTTGCTTCATCCTCTTGTGCTAAAAATTTTGGGCATGCAGTCCAAGCACCCCAGGGCGAATGGTCGTCGGGCAAGCTGCTTAGCAGGAGGGAAATGTACAAGCAGGTCCCACATTGTTCAATATCACTCGGGGTGCATCGTTTAGCATGTTCAAGTGAACTTTGAATTTGGTGAAGGGGGGTATGGCAAATTATTACGTCAGTTCACAAATGTCTGATAAGTTTAAAAGTTACCATCTTCTTCGATCTCAATCGGTACCTACCTAATTCTATATCCTCTCAGTAACAACTATTTCTGTCAAATATGCTCTCCACCGGAAGCGATACCGGAGACACTGAGTGAGCTGCGGCCGCCACCGCGATCGTTTCACAGCCAACTTTTATACCACAATCGTTACCCAAGGATCAGTTGCAACTTATAGTACTCTGGAGATGGAGCTCAGCGCCATAATTTATCAGTGTTCACCGTGTAGTATCATCGGCGCGTTTGATTTCGCCCCTGTATGGCAGAGTCTCATGGGTCCCCCCTCATTAGTATCTTACTTGGCCTTTATCACAAGGTCGATCTTACTGAATTACGGAGTCACGCACTAGGCGGACGCCTAACACGCTGTAGAGAAACATCGTGCAGGGTCTCACCCAGACCCAGAGGTTAATCATGAGAGTAAGCAAATCGCTGGACTGGGGATGCGATGCTACAAATTGAGGTCTCTGCTAACTTCTCAACTACGCCAGTGGACCTGATTCTGAGTGGCCGAGGACCAGTTGGAGGTATCAGTCCCAGACGGGTTAGGTTCCTACCGTCACTGGCGTGACCTTACTACGCCGCGTACAGGAGATTCGTAATCATGGGTGTAATTGCTGATAGAAACGGTTCCGGAGGTTTCATTCATGGCCTACGTCATAATCTAGACGTACGTACCTAGACGGGTCAATGGCGATCATGCTGAAAGCTAAGTTACCGGCTTATAGTACCCTGTATTTAATCAGGAGTGCTACGCGCGGGGTTCTTCGCACTGAAACTTAGGGCCCATGCGCCTTTGGCCCATGTGGTCTCCCAAGTCTTCGTTGGGGGTCAGTTGCAATGGGATCCCGTTAACAGAAGAAGCTGAAGCTCATTTTCACCACTTGCACAAACTTATGGAAACCGTCTTCGGTTCGGTGAAAGAGGTGTGGTCAAGCTGCGTTTGTTGAAACCTGACAGGAAGCCCAAGACTACCAGCACTAAGTGTATACCACCCAATCCAATTGTAGTCAGTTTAGTACGTATATCTATGCAAGTATGTCTCGAGATTGTGACAAACTCCACCAGTCGACGCGTATCACATTCATTTCATCTAAGATGCTTGAGCTGGACGCCTTTGGTCGCGACCTTTAAAAGGCTATGTACCTACCCTCCCCTCCCCCCCTTGCTGATAGGGCGCCGTATTATTGGGGGTACAGTTGGCTTCTAAGTGCAGATCACGGGCCCTCAGAGCTGAACCATGCACCAATCACTCTTCTGTTCTCTATGGGTTGACAAGTCTTGCCGGATGGCGTCACCTGACCATCTGGGCATCCTAACGGTGGCGGACCGGAGGACATGGTCGCCGAATAGTACACAGCCGGAGCCCAAATTTTACGAAGAACGAGGTTCGGCTGGATAGTCTCAGTCTAAGCCAACGATCGTAAATCAGGGCGACGAGGTTGGGTGATGAAATAACGCCGGGAGAAGAGTGATTAGGGTAACACCTTATGATGGAGCCTTTTATAATGAACCGGACATGACTCGCCTTCCCTATCAAGTGCTTACTGACACCCCGTAGGGGCACCACCGCGCTAATGCCCGGGGCCACTAACTATATTCATTGTTATCGGAGCGCCAATGCATCGCACTCAGAGTGTCATTGGCGGGTTGGTATCGAGCAAGGGTCCAGCTGGTGCAGACAATTTGTCACTTTACAACTGCTGGCGTGCATGGTCGCCCTATTTTTTTTACCCGGTCGGCGCGCCCTCAGTTTTCGCTTTTAGACGTCGTAGTCTTGTATCTGGTGAATGCCCCGCCGGCACTATTACCGAATAAACTTGCGAAGTTGGGGCGGAACGCTGGAACCTGGGTGCGCCTTTAAAGTTAACTGGGTGCGCATTAGTCGTAAGGGGCGATTCCTGCATTACACTGTGTCGCACGCGTTGTAAGGGAGCAGGTCCCAGAGTCGACCTACCATTCCATTAGGGTCACGTTCCCAACTAGCCAAGCGCACAGGGAAGGGCGAGTCTGCTTCATGCTTACTAGGCTATGTATCTGTCCGAAGGGCTCCATGCCTGCTGACCACGTCGACTGTGACGTCTCTGATGCACTGAACCGTCCTCTCCTACGGCGAAAGACCGTATTTGGGCACTCCCGGTTTGGCCGTTTTGGGTAGGAGCAAATGGTAAGATCCACCGCCATCCGTCACTTAATGTGGGTCTGTCGTATAGATATTAGCGAGAATTCGCCATGCTTATCACTGTACTAACTGTGTTGCAGGGTATCCTTCTTCTTCCGGCGGAAAAAGTTGCACATTGTTACATCGCGGCGTTAAGTAAAGGTCCCTTATCCGATCCAATCAGAATGGTAGGTCCTAAGCTCTGTCTAGCGAGAAAGACCTTACCCCCGCACCTTTTAATACAGCGACCCAAGTTTTACATGTATAGTCTGTATGGGTGGGAACAAAGTAAGGTATAACTTCAATAGGCAGGACCCCGACCAAGTTGAGGGAGGGGTGTGCTACGTTAATACGACGGCCCACACGAGCTGAGGTTAGAGCTCGTTGTGGACGAAGTTAATATTATGATAAGATGCTCTCCATAAGGATCACCGTTAACGGTATTATCGATTGTGTCGATATGCAAGGTTGAAGCGTTGAGCCATTGGGCGGCCCATGGCAGTAACCATATATTCTATAGTAACTACTGAGCAGTCCCGTGAAATTCGGCCAATCCTGAAAGATAGAGACACGCAACGTATACCCCTGTGTACGCTAGCGCTCCCAGTAGTTAGAGGTTCCGGACTGACAGACTGTACACGCTAACGCATGTACTCACTCATAGTCAACTCCATACAGGTGTAGGGGAAGACCATTTTTTCAGAGTTAGCGTTTTTGATAAACTTTTAAGATCAAAACTATGTCTACGCCAGTGGCCTGGTCCCTAGCTCGGCAGACAGGGTTCTACGCCAGACCAAGCTGCCCATCAGCGCGCGGAAGCCACGGGTAAAAGGTTATTACACTTCGGGAGACCCGCCGTGTGAACGTGCACCCAGTGTTACCCATCCTCTCCCGGATACCAGTGAGGGCCATCACATGTTGCACGTTAAACAGTGCACGCCTACTAAACTCAATCATAACCGATCTATTATCCGAATTAACGTGGGAGTGAGCTTACTAGTTTAAGCCGGCAGCACTCCATCTAATTTCCGTCCAACACCGGGTAATCAATTTGAGAAGTAAATCCCGGGGGGGTGCATTGTAGATTTCTGTGACGCATGATTAGAACAAGTATAAGTGATGAAGGTTGCCCGGGGCATATTAACCCTATATTCCTATAGCGTCCTTAAGATTGCAGATGAATACTTAGCAGTCGCTGGGATAACGCGCAGGCGATCACAGGAATCAGTATGTCCTTCAGATTTTACGTTGCCCGCCGCTAGGCACAGCCTCCGATCCGCGGGCTTGCACTACCCTTTCGCGCGTCCGAGATATGTAGGGAGCCCCGCCCAGGAGCAAGGAGCGAGCGAGTCTTCCATCAACGTAGGGATGATCCACCGTCGGTTTGTACCAGTCAATCAAGGGACGAATCTGCTATTGGTCGTCGAACGTGCTTACGTCACAGGGAGCGCTCGACCCTTAATTGTTCATTGCTTTGATAGATATATCTTCTACATTCGGTCTCTGTGCAAAGTTATACTGAGAAACAACAGACCATTCAACGGGATCGTAAACGAACCACACTCTGACAAATGTTACGAAGTGGTGGCGGAGCAGTCTACAAGTGGCCAACGATACTATTTCTTGGCCCTCCATGTGTACGTATTCTATTCGTTGCCAGGGACCAATCCCCGGTCAATAGCCATCCTGAGGCTCGTCTAAAATCGGAAGAGTCGCAATAAGGCCAATTAACGCGGCGTCGGGTGTGGCAGTATCTCATATGGCATGCACGGGCCGTTGCGTAGTTTGATTCCATGAGGTGTAGTGATAATATTGCCGGAGGTCTTGACCCGGGAACTCGAGCAGTTGGACAACACGGGTAGTCATACGTGTCATATACAGTGGTGTGCCGCGGGATGGTCAGTCGTGCTATGGATTAGTGCTCAAGAAAAGTCCTTACACAGGAGGATCAAGGTTTTACACAACACATTTTGTCCGGTGGAAGGTAAAGACCGTGTGCAAGAGTTAACTGTAGCATGATCACGGTGGTCTGCCAACAAGGGGTCACCGACCCGTTGTCATTCCGTGGCGATCGCCGGGTGAGAATAGTCAGGATCCTAGGGTCTCGGCTCTATATACCCGAGAAGTCTGCCGTTTTAGAGAATATTATGGATCTTATCCGTAGTCGTCGGGGATGAACTGCATTGAGGTAAGAGAGGTGTCACGACGTTTAAATGTAGGCCCATGTGATCTGTCCTTCGGTGGGTGCCCAAACCCGAATAGTTGGTTCAGAACAGCGATGGGCACACCGCGAGCGGGTATCCACAGACTCACAACCTTGTTCAATCCGGTGTCTGTGCGCTGTCCAGACGACTGGATCTAGTGACGAGGTTCAATCGAATCCGCTCCGAGAATTTAGGATAACTGAGAGGAACCCCAGGCAAGCCCGTTGCCCTTCCTGACCGGTGGTCATTTGGACATCGCTAGAGTCGGCATAAGGTACAACATGATATCAAATGGAACGGGTTGAATGCGTACGCTCACAATATCACAGACAGCTAGCGGGTACCAAATGTGGTGCAAGAGGCGCGAAAACGACACGAAGAGTCCTGAGTTATGTTTGCCCGTAGCCGTAAACATTTTGTGAGGAAATGTTATGAGTTCTGTTCAAGTCAGGTTTCGCCTAGTACCTACAGTAACCAAACGATCTATTCTGACACGAACAGGCGAGAGTATGAGCGTTTCTCGGCACACGCGTAATACGCCAAGCCATCACCGCATCCCCATGGGCCGTGGTAGCTACACTTCCCTTGTCTGGCTGTGTGTCCATCTAAAGCTAATGTATGGGCGTCATCCAAGAAGTCTGAAGATCAGTCTAGAGACCCCTGGTCTGCAAATTCGCGATTCCCCGTGATCTTGTATCAAGATAATGCCACGTGATTGGCGCCCCACCACCCGTTCCGAGAGTGTCTACCGAATGAGGATTAATCCAGTATGCCTTCAGATGCCTCACGTCTCCTACGAGTGGGAGGTCTCCAAGGGTTCCCGGGAAGGGGGACTAGCGCAATTTAAGTCGCTCTACCTAATGGTATATTTCGGGATCCAGTTGGAGTTAGAATATTACTAGGAGGTGCGGATGGCTAGCGACTTTGGGCAGTTTATATTTTACCTTGGTTCGAGGCCTACAATTGCATAAGACAACCACCAGATTCTTATCACAGATTCGCTTCCTAGTTGCTTGCATGGTCAGCGACCGGAGCCCATCCGTATCATAGCACGACAATTCGACCTGTGTTTTACGGTTCTTGCATAAATGAGGTACGGCACTAGTGTCTTTTTAACGGGAATCCAAGCATCGTCGCGCGGGATGCGACCTACCGTGGTACCTCTTTCACCTCTCAGGGGCTGATTCAACCACGCCGGATGACTTAATCGTCCATGTCACAAACTTTAAAGCAGGGGGGCTTCCGTGCCCCGTAACCTCTTAAAAACAGTGGAGCCAATTTCAGGTCTAGCGTACATCTTGGGTCTGACGGAACCCTTGCGGGTGACTCATTGGTCTACGCACAGGTTTTTGCCCCGCTGAGGACAGTGCAAAACATCCTCCTAAGGTTTAATGAATCAAGCCAGCTGCGTAAAAAGAAACCCTCCAGTGCAATGGCATTCCGTTCACCCACTAAACTCTTAAGGTTTGGAAGTGACCAGTACTTGGCCAGTAAACACTCCGGGTAGTCCGAATCTTAACTGTTCCAAAGTCCATGCATTTGGACTCCGACGTAGGAATATTCCTTCTGAAAGCATTCTGAATGATAACCTTTCTTAAGATGCTTCGCTCTATTCAAAAGGCTCGTCAAGGCGCGGGTGTTTTCAGAGACGCTGGTGCCGTTAGTGCTTTCGTCTGCTGAGCAACCGCCATACCCCTCATGGATAAAGTTGCAGCGTCCATCAGGTTTCTACTTCGGAACCATGGATGACAAACCGATAAAGCGAACGCCGTTGCCGCCCTGTACAGGAAGGTCGTTGAGGAAGGACTCTGCAATCCATCCCTGCGAACTTTAAGATACGTAGGGGCAACTCAGATCCGTACCTCTCCTTATCGCATCTGCCGCACGCCATGGCCAACCATTATCAGTGCGCTTTTAATTGAAGGCGTAAGACCCCCTGGGAAGCTTTCCTTGATTACCTGAAGTTGTTCTCGTGTAATAACGGGTGAGGGTCAAACCGCTCTGACCCGGGGTCCACGCTCTCGCCCAGCGTCCTCTGTAGCGGTTGTGCAGGTGCGTAGCGGGCCTTGCCGTTTAGGGGCATAAGGGATCCGCAATGCAGCAATCCTCCCTTATAGACAAACAGGGTCTACGCACCAAGTAACGGCCTTTGAAAAATCCAGGGATCCACGTTTTTGTTCTGTTCACACATGCAGGGAGGTATACGTGAGCGGTAGTCTATCATTCCAGGAAGTATTGGGTTCGGCAGCTCCCCAAGTAGTAAACTCTAGTCGGGATCATCGTAACCCCGAAAGTTGCTGGTTCTAGATGCACACTCAAAGTGAAGAGGGAAGCCGTGTTCATCAGCCATACTCTCGTATAAAAAATAAGCGGCGTCGTTCGGTCTTACCAGGTCAAGGCCTAGCTAGCGTGCCCGGCATAAAGTATTTTGATAGTCGAGTCTACATATAGGCAAGTCTCTTCGCACGTATAGGTCAGGTCTACGCTGGCGGTTAGTGTGGGTCTCTCGCTGCCGATGTTTTGCGTTAAACCATTGAGTTTCTCAATTCAACATTCAATGTCGAAAGCAGATAAACTTCGCATAACACAAGGAGAGCACACGGGTGGGTCGTGTCGAGTGGAACTCGAATGCCACTCGCTGGCATGCAAGCCAATCAGAATCCCGAGACATCATAATCGTGCTCGATTGTGAGCGACGCCGAAGCATACGCAGGTGGGAGCGATTTGAGTCTCTTGACTTATTGTCTATGGCCTTCACCCCATGTCTTCCTTGGTAGATCCACCAGATTTTTGAGCTGGTCCGGTTTAACTTCGGAGGGTGATATCAATTGAACTTCTACCTAACGATGCGTGAGTAGATTCATATTGTCGTAAACGAAGAAAAGCAGACCGAATTCATTGCCGCACATGAAGGGTGGACCGAAGCTAAATAGACACGATGGGCCCCCAACCGGCATTCTACCGATCCAAGTAACCGGTGATCCTGTGACTGGGAGCGTATGAAACGCAGGCAATGTTGCGGCGAGACTGAAAATAGACAAAATTTGACCGCGATCGCGGAAGTCGCGGGGCGGGCTATCGGACCTAGAAAATGAATGGAGAGGTCGTTCTATACTTCGCTTCGCCGACTAGAGCCAGCCCCATTCGTGTCCAGGTCGTAAAATAGTTTTGACCTGGTTTGATATTGAACGCGGGAACTCCCGGATATCCCCGAGTGCGAAGACCGGTAAGTGGGCCGCTTGTAATGGTTTCATCAGTACTCGGGTTAGTACATAATCTTATACTATCAGCGTACAGATTAAATTGAGATTCGTCACCAGACACTAGGCGGCGGACCTGCAGTACATATTTTTAGCCCCATCATGAGATATGTTCCAAGCAATTCAGGGGTAGGCGCGATGCATATAATATGAAGCTGAACACGAGTGGCTGTCGCATACGATGAGGTCCGGCCGTGTGGAAAACGGTCTCTAGGACGTAGCCTATGTTCATAGGCACCTTGTGGCTATGTTTCCCTCACTACGTTATTCGCATAATATCTTTGAGACGTCCCGAGGGAATTGTAGTTGACCACCGGCGCCCGGTGGACAATCATGTGCACATTACCTTGTGTTCCTCCTAGACGCCTACTTACGTTGATCTTCTAATTGGCTGGTTATTGTGATTTTGCCTTAAAGTGATGTGTGTAGTATTATGCGACCGGTAGACACCTAGGACTAGGTATGATCAGGCTTCTAGTATTGAGCTGCCCTGTTTTTTTTTTCTACCCTCTATGCTTGGGACGAAGCCACAGGCTCGGAAACGTATGAGCCCTCTATCTCCGCCTTCGTGATCCGATTGGCAGCTCATTGTTGGATGTGAGATCATCCAATATGCATCCGCTAGCATGCAGTGATGCAGGACGGGTAACCAACCAGCCGACTAGCCTTGGGGTGACGCTACAAGGGGACATCACAACCTCCCTATACGCGTTGGAATGACGAAGTGGACGACTCGTGGTTAAATCCGTTACGAAATCCAGACAATCGAGAAACGTATACAGCAACCACATGTCGGCTGTTCAATGAGAGTACTTGAGCCTTTAAGTAAACAGGCGCGTGCCAGCATAAGGGTGTGTAACCTTCCCTCGCAGATCCCCAGCTTTTTGTGAGTTCCTCAGTTCTTTTAGGGGCTGTTGTTCTGTGCGAACCTTAGCCGCTCCGTCGTTGCGGAAAGCCTAGAGAGTGTGCACTGTAAAAGTCGACAAACTGAAACTGACGTGTCGATCCTACCAGACCGGCTCACGAATGATGTCCCCTGCGCTGTTACCTCGATTCGCTATTGACCTTAGTTCGTGCGTGACTTGGGCTCGAAGCCTAAATTAGTGTCTATTCCCTCATGCTGGATACCTGGCAATCGATGGTCAGTCGGTATACCTGGCGTGTAAACCTTCTCGAGCCGTGTCAAAGGTGACGACGGGGTCACGCAAGAGCGCCATTTGGGAGCACGACAGTCTACAGGGGACAATTCGAAAGCTCTCAATGCCTCCGCGTTGCAGACTTTGCATTACGCTACATTCTGGTATTTACAGACAAAATAACTCGGGGAGACCGAAATTAGCTTGCAGATACACGTGTTATTACGTTGTCGCAATTCTAGAGCATCAGGTCTGTGAGGCCAATAGCTCTGAGCGTGAGATCACGTTTAGGCACATCAGACGGGATACGGACCAGGTACACGTACGATACATTTTTTACGTAGTTTTTATGTGTCTATAGTCGGCGCCGCCATGCCACATCTGCGTTTCATAGGCAACGCACGCACGACTTATCATAATCACTGGTCTGAATTTTCGAAACTCCTGGAAACTTCGTAAATTGGGTCTTAGCAACGCAGTCCGAGGTAACTATTGCCTCAACACGCATTAGCGGGCGACGAGGCCACTTTACCTGTTAGGACGTCCACAGAACCGAAAAAGAATGAATGAATTAAATCCATCAGCCTGTAGGAACGGAGCTGACGGGCCTGCATGTATCGCGGAATCGGTCCTTATTCGGTTATACGTACTAGCCAGGGGCGGTCTCTCGTCCCGATAACTAAACCCGAGTATTTATGTACCGGTACCCAAGTACCAAGTACCCCCAATCAGCCCTAATTTAAAAGCCGCGATGGTCGATGCATATGGAGCGTGGCGTGAGTAAATACGACCGGTCACGGCGCATATACTGAACTATGACACTGCGAACGCATAAGCTGAGAATGGGAATGAATACGGACGTAACGTTCTTTGAATCAAAGGGGAGAGACATGGCAAGCGTAGGTAAAGACTTCGATGTTGTAGTCGCGTGCGCCCTGCATATTAGTAGGTAGCGTGCCCGAACCTCATAATGCAATACTGGGATAAGTTGAACAATTTGTTTACGGCCCTAGGTGTCTATTAATAATTTGTCGGTACTATCTAACCTCATTTCCACCAGATCTCAGAGAGGAGAGGACAGAGTACGCTCCACAGCGCAAAACATACGAATGAGACTAAATTACACCGTTAACCAACCTAGGGAGGGTTAATTGGCCAATCCGTGTCGCTTGTCGCGGCATAAACAAGTTGGGTGTTCAAACGCGCACTTTTGATGGGTCCCTCGTTTAGGAGATGAAACTTAGCGGTAAGGCGAAAAAGTACAGGGGTTACAATGTGACGTTACCTTCCATTCTAATCGCACCCGAGAAGCCCCGTACGGTGATTTCAGTATAAACCTAGGTCGGGAGCGACATGAGATCGAGCCTGCCAGTCACGGTGCGCAATTAACCAGCCACTCGCGCTGGCTTATTGAAATTCTGTTGAGTCTGTAGGTGGTCGAAGATTAACGGTTTAATGTTCTGCGACCTAATCTTCAACTGTTAGAGTATTAGAACAGGCTATCTGGACCCTGGTGAATCACAATCGTACCGAGGGCGGCGTGTCGTTCCCTATGTGGGGCTTCCCTTCCCTATCAACTGGTGTGAAGCCGGTATAACGTACATGTAGTTACCTCCGGCAGTTGCGATGAATGCCAAATGCTTACAAAGACTGGTCATCCGGATTTATGAAATTCTATCTATAGCGCTGCCTATCCTTCACGGCACAGGATCTCCCCCAGGTATGGCACTAAGAAGTAAATAACCCAGGGATCTGTTGACCTATATTGCCTACAAATCGCAAATCAATATAATCTATCCGTATTCGATCTTTCAGAAATCCTCGCAAACCGACAAAGGCAGATTGCAGAATTAACTTGTGTGATGCACCCTACTTAAGAACCCGATAGCTCACTTGGAACTAACATCATGCCGAGCTGGGTGCTTGAGACTTATTGCATACTGGTGGTGAGTGCGTTGATCTCCGCGTGTTTCCAGTAGAACATCTCTCGTCCTCATTATAGAGACTAGGGTAATTCGTACGTTGTCCTAGGAACTCCGTTGTCCCCAAGGATCGTATTTGCCAGTCCTTTTGCCTCGCATCTAAGACGGGTTCCAAAGTATACCTCACTGTGGATCATAGCAAATTACGGGTAGGTTGAGAACAAACAAATCCGATAGTTAGAGAATCTCTGCGAAATTCACATTCGTCGTTCTACTGATCGTTGAAGCTGTAGCGCATCTTGCCTCATCTCAATATCTTTTACAGATACCATCGCAAGGGCCGGCCGTATTCTAAGACCGGCATCAAATTACTGGTTGCCTGTTTGTAGTACAATCAATGTCTCCGGTGTAGATCAACCTAGAGCCTAGGCCGGAACCTGCCCAAATCGTAAAGGTTCAGGCCGGCTCTGAACCTTCTCTCAGTATTTATGTGTTAGTTCCCGCGTGCCGCGGCTCCGCACGAGAGTGGTCACTAGGAGCTGGCACAAATATGCACGCTATGCGACCGGAACGCATCACACAGGCGCTGGCTTAAACTAGGTCGACGGAGTATCGGGCCTACCCGTGAGGGTGTTTCTTGATATTAATTCTACCTTGGGGCGTGACAAGTCCATCGGTCTCGCGTGCCTCCTTGCCACATGATTCTTAAGACCGCTGGATTAAACTGGTTTGCTGACCTAACGAAAACAGTAGTGCCTTCAGATCGCCTGCAGTGTCATTGGATCCAGCATCGCGGTTTCAAGTTGTACCCCCTCTCATTCCGAATAGTGTCCTATAGGTTTGGAACAATAAGGGGGGTCAACTCGTGCCGGAAACTTATGGTTCGAGACCAGAGCAGGTAGTGGGCTGGGTTACGCATAGTGGGGCCACAGAAAAGTCGACCAGCGCCTTGCAGAGGGGAAATGTGGGGTAGCCGAGTACTGATGGCACGCCGAGAGTCCCTAATGACTACACTTGAACGCATCAGTGCGAGGGACAGAGATGGGTCTCAAGCCTAGCATATAGGAAGACCCCACAGACGAAACTATCCTAGTTGTAATAATTTACTACTGTGGGCACCATGAAGCCGTATAACATTTGCTTGGTCCCTTGTCAAATTTGCCCGGCATTTTGCACCCATGTGGCTGCGGGTCTAGGGAACTAAGACTAAGCAATGTACCTCAAAGCCCTCAACCGTCTACAGTACAACGTGTATAGCACGTTCGAAGCGATCTAGCCGAAACCACGATGTGCGCAGGATAAATTCGGTGGCAAGTCGGCTATGGAAGTGTAAATCCACGTTCGACGTAGTGCGGCTTATACCGATAACTTACATTTACGGGACTTGAGCGCATCAATGTTATACAAAACTCAAAGGGTGTGTACCGATAAGTCATTGGGTATCCCCCCCCCTCTGGGTCGCTTAAAGCCTGGGTGAGGGGGTTTCTTATTAAGGTGGGGCTACCATAGTAGAGAGCAATTGCCGTGGCTAGATGTGACAACAACAAGGTTTGCCCAGTCTCCTCTATGCGACAATAGCCTGCCAATAAAACTGCATCCTACGGCACAGCATGTAGCCTTGCACCAGGTACTCCTTCGAACATCAACCACGGCACTCTTGCATGGATGAGTTTTGGGGCTTTTTTGAAGTGGAGGCTACCCCGAAAAGGTTCACTTCTAGCCCTCCCGGCCACCCGGTTTCTCCCTCTGCCTCTTGTTTGATACTTTTTTGGACGCACCAAGGGCCGGCCCCTATGCTCTGGTACATTGGTCTTCCATATTGACCTACTTTCTTACTCGGACATCGATCGCTTCCAACAAATATAAGTACCATGTAGTCCTCTCCGGCACGCGAAGTGTCGGGATACCGATTCAAAGGTAGGGTCGGACATCCCGCGAAACATGGCTGGTAACTCAGGCCGTGTACTCTATGCGTTCTCTGTGTCTTACAATTGGGGCATGCCTGTGATACGTTGCGATCGCGTTGGCCGGGCCGGGACCAATCAGCCGTTTAACTCAGATGCGTGAAGTTTCGCACCGCATCCTTCACTGCAGATGTTTTAGTGGCCTTTCTCGATCGCTGCATGCTGTTTCCTATCGTGGTGCACTAGCGTTAACAGGAGTCCAACGACCGCGCTACATAAAACGGGTTATTTTGGATTCGAGCGACTTCTTCGCACCACTTATCTCAATTCAGACGATCAAGTATGGGGTTTCCCGAAGACCCCTGCCTATGAGTATCATTACTGCGCATCGTCGTGGGCCGCGCTCGTCGGCTGCTAGTAGTTTGACCAGAGCAATCTGGCCATAGTCTTCGTAACTCTGAAGATAACAATGGGGTAGGCCCGACCATGATAGACATCACTTTTGTGATTTCGCGAAACCTACGGGTTAGCATCCAATGGCCCGCACGCCATAGTCTAGCTTTTGGACTTCCGGGGTCCCCCGTTGTCTCGGCATGATATGGCCCGATATGTTCGGCCGCGCATGACTCTTAGAGTATGCTAGCGGTGTCTGATGGATTAAGAGACGCTTTGGTAATGAGTGGCAACTACCGACGTTGCGCTTGGTTCGATCGAACTTACGTACAGGCCTTGATCATAGTATCTCGCCAACTGGTTACCTGGGCGTGCTGATCCTTAGTGATATTAGTTCCTCCCAAGCGTACCGGAGGGCCAGCCTTCCGCTATAACATTGAACTCGAATTCACCGCGAAAGACATTAGGGGGTCTTTAGTCACTATGCAGTTGGTAATTGCCAGGGTGCATAGAGCGCTTAGTTTCTGCCTTATGATCGGAGTGACGTACGTTGGTAGTGTAAGTCTCCTGCGGCCATCAACGGGTGCTGACTGCGTACCCGAAACGAACCGATGAGCGGTATGTGCCGAAGGAACGAAGGTTCAGTTGAGACGGACGGCGTTTGTACACGTCGTGTGTTCCGCGCTCCCCTCGTCTCCGTCCCCCGGCATGTAACGTGCGCGGTCTGTGTGGTGACCCAGCGCTAGTAAAATGCACCGCGTTCCCTCAGCACCTAGATCTCCGCCATATGTTCTTACCATGTGGGTGAGTCCCAGAGTTTTAGCCGCAGCGAAAGAAGGCTCGTTTACATCAGGATGTCACGGCTCGTCCGCCGACAAGCTCTACTTCAACTAGACTCATGAGGGCTGGCTATGAATTGCAAACCGGGTTTTCCATCGGATGGCGTTCCTCAGTGCTAAAACGCGGAAGATCGTACGCGCCGTCGGGCCTAGCGCACCGTCTACGTATTGCGGTACCCGACCCGGACAATCCACTCCATTGAGGGACGCGGGAAACCGTTTGGTCGCTAAATTGACTGCTATTTCGGAGATGTTCCTCGTCAATAGCTGCGCACAGTGAACGGCATCAGACTCTGTGGCCTGGATAGCAAATGCAGGTCGCACCGTCGCTTGAAAGATGCCGACTCCCTTCCGCTCGGCACCAAAATCTCGTGTTACTCCTAAAGATTATAACTGGCGCCTCCTTAAATGGCAACTAGGTACTCCCCCCGGGTCATATAGGGTTAGTGCCCCCAATTGCGTGGGCTAGTGCCTGAAATCCGAATTCGATGGTACATCCGGAACCCACGGTGATACGGATTTCTTGAGCAGCGTAAGCTCGCCGTGAACACGACAACACACTATCGACCTGCTTTCCTGCTTATTAAGCCGAGTCCCCGCACGGAAAGAACTCTTGGGCTATAACCTGGCCAACTTCCCACATTTCTAAGGGCTTAACCCGTTTAATGGCTGTTTCCCATCTAACTATTGGGAACTAGCCCCGCCGCCGAGGAATAGCGCACCTACAGAGGACGGTCCTAGGTTCCCCCTGGTAGTTACATTTAAAAACCCGTCTTGCAGAATGCAAGCCCTCGGCTATGGGCAACCGGTCCAAGGTTCGATACTATATAGAGTAGGATATTGTTACGCTCTTCAATGACCGACAGATATCGTTAAAGCGTGAGAGTTCGATGGGCAACACACAGGGTTACTAGGCATAATCCCTTTATAACTTAAGCATGTAGTCTTATATCATCTGGTCCGCCAGCTCGTATCAAGGCATGTTCCTTCCCGACCCATGTCTGTATGACCAGATCCAATGAGAGGACCCGCTCGGCGCCACTCTTATCGGTCCATTGGCAGCGCAGCTTGTCGGCACCTCATTCTTTCCTGCCACGGGTCCCGGGGGCAGGAGCATAAGCGTTATAATGACCGCTAGGCTACCGGCGTCCAACAAACAGCTAAGCCCAAGCGGTGCGGAGGGGTGTGTGTGGGCTTATTTTTCCATGGAAATGCGACGCGGGTCTCAACGCTTTTGAACAACCCTGTCACAAACTTAACTTAGATTACCAAGGCCCCGCACACAGTTCGGGCGGCAGGGAACGAATGCATCATCAGGGGTCTATGATGGGACCCCGACTCCTCTCGTTTACCTCAATGCGTATCGCGGCCAAGGTTCTTGCGACCCAGACACCTACTGGGTAATCGACCGAGGAATGTGACCTCCTTGGTAAGTGGATAGGATAGCGCATCACACCGATTTGCAATCATGCCATCTCCATCAGTCCCACGCTGCCTCGAATACCCCTCATACTTGATGAGCTAACTCGATCCGACCACCACCGACATCCCGCAGGACCCTACATTGCCCGCAGCACCCGTCACACTGACGTTGACGCTCACACAATTGAGCGGACTGTAACCTCGGACTTAAAGTACGCCGATTTGCGGACGGAACTGAGTGGATGGGGGGCCTGAGACACCGCAAAGATGGGCAACCAAGATGCCGCTGCTCCACCTACGCATATATAAGACTGGGACCTATTACGAAGGTAATTCCTGCAACCATCTTAGCAGGTCGTGCTAGAACGCCCTCAGACAGATCTCCAGTCAGAGCAAAACCTCGGAAGGATATGATGTGACATAGACAGGAGTGAAATGGACGTCTATCTGGGTCATTCGTGTCATATAAGCCGAAGACTCCGACTACCCGCAGAAAGGGTGTCAAACCACTCCGTTCGCTGAGCGGGGTAATAGGTTCAGGGTAAATTTTCCGGGAGCCCTTGTGACAATGTGCGGTGGAGGCATAACGTCGCTTCAATGATATGTCTACAGCCGACGTACGGAACGTCGTACGAAATTCTGCAATCGAATTGCCTCTGTCGGTCTGAGACACCGTGTACTCACACCCAAAACACGACGATTGGACAGCTTCCAGACCGCATGTGGACCTTTTTTTACAGAAGATCAATGACAAACTGATCAGTGGGGTGCATTAACCGAGCTTTTCCACGTGCGGCTCTCACTTAACGTATTGTGATGCGAGGGCACCCCCGAAGTCAAAGTCGCAGGCCGTGCAGTATTCTTTATTGAACTAAATTATGGGTGTCGGTCCTTTGGGCTTATTGCGGTGGCCTTTCACCGACACACCCGGTAGTTTAAGTAGGGCCACGAGTTTCATACTGTCAACTATACAACGTTGCAGACAGCATTGTACGGATACTGACCGATGATCGATCCTTGACGTCGATTATTTTCCTCCCGAGGTCTTGTCCCTGTATTTTTCCAGGGCCAAATTTACAAAACTAACTAGGGCGCTTCAGCGGAAACTGGACGCAATTCTGTATACATCGTAGACGCACTATGAGGCCGGGTGCGCACTGCTGCGTCAGCCATACATGGTACCAGACAACTTCCCACACGTAAGCACTGCCGAACAGCCTAATTGATTCGCTACGTGACCGCACGGCTAATCATAGGTCAAGCCCAGGAGAACTAATCCCAAGAGTTTTGCGGAAGCACTCACCTAGTTCGGGTTAGGGGCGGCATATGAACTGCCTGCCCCTCTCCTAATTCCATGATGGGTTGAGCAATCTGACTGTCCCGTTGATCGGCAGTGCGTGGGGTTATATTGGCGAGAGTAGAAAACGGCGGGCCACGCGTCCCCTGACGCCTCGACTTGTACTCGTGCGTCAGTCCTTGCACCGACGTGGAACGAAGCAGGCGTCAAGTACCAAAGCCACCATAATTGTGGCTCTCTGCCATGGGAGCTCGTCGGCATAGAATGCCCACAGTCGTTTCTCAGCGTACTAATCCAGTTCTTAGTATTGTACCAAGCAGGAGTACAGAAATGGTCGAAGATTACGAATTAGCCGGGCGGCCTACGTTTCAGTGTTTGCCGGTCGAAGCAAGCCAGTCGGATGGACCAATCAACGAAGTCGCCATCGGATCTGTACAGACTGTCCTTCTCGATGTCACCAATCGCAGGAATATCGCTTCGACTATGTCCACATATTGCGCCAGCGCAACAGCTTCTGGGGACAGCGGTGGATTGTAAGACTTGGCCGTTGTCGGTGAGGCTTGCGGGACAAACTCCTGGCGGAACTGGAGTCGATTCCGCGAGCGCACTTCGCATGCTGGTATGCAACATATAGGTGCTTCCTTCCCAAGTTTCCATGACTGATATGTGGACGTAATACAGGCGGATATCGTCTCTGTTCATCCAAACGTTCGTCTTTTAAAATGCTCGTTAGATCCATCCTGGTAAGTCCATGCTTCTGCCACATTAGTTGCAAAACTTGCTCACGCTGACGGCGTGCGCTCATTTGCACGGAGCACTGAGGTACGGATACGGGCCGCGTATAAACATCCTGCGTGTCTTATGGTTAGCCCCGCCGATATACAGGGAGAACGATGAGAGTGCTCACTCCTACATTTTACACAAGCGAAGGCCGCGACCAATAAAAAATAACGTAAACTCATTAGAAGAGCTTCTGGCCCTTGCCATCTCAACCTTGTCAAGCTGGCGCGCAAAGAGTAGCGAGAGCACAGCAACATACTTTAGTGGTGGGGGGCGCAGTCATCCAACCATCACGAACTCGTATATCGCTTCAAAAAGTTTTGATGTAGTTCCTCACCGTCGTCGCGAACTATTTTATTGTACATACTAATTCGGGGGGTGGTCTTGTATCTGTCTGTGCGCTCTCTTTAGAGTTCCGGGGTGGTCTTCCTCTTGGCTGAGTTCTCAAGAGTTCTCGGGCGTCCGAACCGGTGCCGACCTCCGCCGTATCGGAACCGTTGAATAAATCTATAGCCGTCTCGAGCTTGGGAGAGTGGTCATTGCAGTTTTGCTTCCCACCTTAATGAAAGAACTACCTCTGGTGGATAGGTAAAGGGGGCAAACGGATCCAAGTACCTGGGGAAACACTGCATCGTTCGAACCTTGAGCCGGCAAGGTCTATCCCAGTCGGTCGACACGGGGGCGATGTTACCGACTAGCCGCGAGGTATTAACGACATTGTGACCTCTTTCGGATACTTAAATCCATGACGCATGACGATCCGAGTCCTCTCGGAGAGCCCGTCGTTTCAATGACTTGCGCTGTTGCAGCATATCTTTCCGCCAATTGACTGTCGCAGACTATATCACAACTTATTGTCAGAGCCAAAACCTACGGGCACGAACGAGCAGAGCCACTTACGATAAACTAGGTTGACGCTGCCAGGGCGCAAAGTGGCTGTATCGCCGTCGCAGCGATTATGGGCCCCAACCCTATTGTAGCTGATTCAAGGTGTTGACCAGGCGTCGCTTATCGCGTTTATGAATCTCTGTGAGGTGGACTGATGTATAAGTACTCGTTACGTCTTCTACTATTGCGTGAGGTAGGAGAATCCGCGTGTCAATAAGGACGGCTAGTTAATAGGTACGACGTGAGAAATACAGATGCTAGGAAAAGTTAGATGGAGGACACTGCTTGTCGTAGGGATTTAATAAATGTATGCATAGGACGCAAATCTGCTCGCTGGCTTCGTGTACAGGCACGACCGACGAGAAGTTTAGGTTCTGCAGAAATGATTACAACTTAACGTGTGAAAAAGGTGTGGTCTGCTTTTTCGACTGCCGTTTTCGCCTACGCACAAGCCGACAGACGTCAATTTCATTGTAACGGAATTTCGCCCCATCGATCCCCCACTGCTCGACTGGCCTAATATATCAGGGGTAAGGTGGGTTTTGCGCACGCACCGTTGTCGATGTTCAGCGTGTCCCGAACGACCGGACACCTTTTAGTATTTTACGTTGATGGCCTCAGCCGGAAGGACTGAAACCCATAGCCGCTACCCAGGGTCACGTGATATACGGTGAGGAAATAAGTGGCCTTCGAAGCCCATTTAAATCGATGACGAGGGCATTGCTACTCTACGTCCGCTTACCACAGAACCATGCGTCCCAATGTTGCCCACGCGATAGCGCGAGATTCATAGTTTGTAAGTATCGACTACGTTCCAACAAGAGGTTCCCCCGAAGACCTACTGCCATGCCGCTAGTCCTGATCCTGGGTCTCACTGCGTGTGGGGCCAAGCCGACCCCCGTGCAGCTAGCAGCTAGCTCGGTGTAGTTGTCTACGCCGTAAGAGGTAGTAGTAGGGTAGGATCGACACTAGGAGAGTCGACATAGACCAGCAGGCGTTTAGCGGCGCTGGCGATGTCACAGATAAATATTCCGCTTCCTGAAGCAACTCGCTGGAATCTTTATAAGCGGCGAGACGGTTAGCTGCCCTACGTGGGTTCTACGAGCTATTATCTCGACTGGGCGCACAGATCACCGCTCCTCGCGTAGATATGATGGGGGGGGTATGTACGGCGTAACCGTGTAGGGCTTCTTTGCCGTACCTTTTTGATCAACGGACGTGCGTGTATTTTGACGGTAAAAAAATCACCCTCGCGAGGACGAGCTATGTATTCTTCAGGAGTGACAAAACGGAGCACTACTACACGACTGAGTTTTGCAAATCCACTCCGGCAAGAGTGGCGAAGCAAAGCGCAGCGGATTACATCAGTGCAAGAGGACGGGAGTTTATTCAAATACCCTCGCTGCTTGCTTCTAGCCTCAATAGCTCGTTTACTCTGATCTATCGGTCGATCGTTGAATAAGACTCAATCTGCGTTCCACGGGATCACTCGGGGCGGCGATCTTCGGTATAGCGGGTCTCCAACCCTCATGAACAATTGTTCGTCCCCCCGCGCGGGGTTTACACGCCACAGTTCCGGAGTAACCAATAGTAGTGTATACCAAGGGACCCCACCCAGAGCGTTCTTCCCAACCCCCACAAAGTCGGTATTTGGGACTCGGACTTACAAATTTAAAGTGAAGCCAGGTACTGCACTACGCTAGGGACTGCTCGGTTTCTAAGTAAGGTCAAGTTTTATCCGGGGCGCTAAAGACCACGTGACGCCGGGCTGCGAGGAGTCGAATTGCCTGTTAAATGTAGAGGAGTACGGCTTCGTAGAGCCACGTAAAATTGATATTCAGCACTGTTCGAGTCATGCCTACCCGTTGCCGCAAGTATGTAAGATGCACGTCGCAGTGCCCGCAGACAACACGGAAAATCTTTTTACACTGTAGAATGCGACACAATCCCACATCATCGGGCAGCAATCAATTTATTCGGTTATCGAGAATGGCCGGTTGAGGTTACTAGGCTAAAATACCGTGACCATTATCTGGGTAGAACAGGTTCGCTATTCTTCATTGTACACCGCTTAGCCACTTGCTAAGTAGCGGTGTCTCCTCGCTCGAAGCTCATTCGACTAATTCCTACATTTACGATGTGGCACAGAGGAATCGGATCCTGATTAAGGGGCTATGTCCTAAACGTAAGACTGGCGACTATCGGTTGAGCTTTTCGGCTTACGTATCCCACGTCCGTGTAACTATTGGCCCGAAGGCTGAAACCCCTACTGATCAAGAAAGAACCCCTTTTTACTTTTTATCTCCAGCCTCCGTCGTTGCCCAGTGCAATGCGGAACTGCAGAATTGGGTGGCCTGTGACTAACCCGGAGCCTTACTAAGAATTTTTTAACCTTGATATCCATTTCATTGCGTTGTGCCCATACTAGTTCTTGTCGAGCTTGTTATTGGCGTCACGAAATTGAGTAAACTGTGTCACATCCACATCCTCGTACCAGAGCGGGACGGGCGCTGTTGCGAGGGGATTTCGTCGCTGGGAAACTCGCCTTCACATCCGTCCCTTGGAACGCTTCAGTGTGCTGGTCCTAATTAAGGATACGTCTAGGAAAATTTCATATTATTAGCCAAAGGGGACGAACGATAAAACGAGGTTGGGTAGGGGTAGAATCCAGCCTGAGGAGTGAATGTCCTTGACACCACTTCACAATCGTCTCCCTACTTTAATGATGCGTCGGATACATGGGGAATGCTCGGTCGGGCTGTCAACGGAGCCAGTTAACAGGCGTGTTAGCTTCCTCGTAGGCTATCAAGCACTTGACGTTCTGAAGAGGCCCCATCACCCTAAGCGTCTCAATCGGAACTGTGGTCAGGACCATTATATTTCGGCTCCTTGAAACGTGCTGTAAAGAAGATTAGCACTATCACCCCCTGGACTGAGATCCTCACGCCAGAAAAACAGTAATAAGAGACATGTACCCCAATAGGTTTCGGACCAAGGATTATAGGTTATACCGCGTTGTGCTAACTTGACCAGCCTTTTGTTTATAGTCTGCAACCCGAGCTGGATAGAGCGCTTAAGTCACTGTCTACTGGCCAACCCGTCGTGGAAAAGACTCCATACCGAAGGCGATCCTAGCCGATCCACGCTGGTGCGGTGGGTTGTGGCACGGGTTTCATAAACCCTACCCCTACATTGGTTGCAGTTTTTCACTCAATTTCTGGGCGCAAGAATGACAGTAAGATAGCATCGTCCTTCAATAGGGCGTGGCGATGCCGCTAAGCTATATAACATTATTAGGTCGGCTTGTTTGGAGTATAGCCAGAGACTAGAAAATTCAGGTTGGCATAAGGTAGTCAACACATGCAGTGTAAGCATAGGTCCGTCGTATGTCGTACAGCAATAACAAGCATCTCTGAGAAGCATAAAGTTGTTCGAATACACAGCGCCGGGTGACAAGATCATCTGTTTGAAGAGTTCCGTTTCGGAAATACCTCTCATTAGTAGACACCGACGACCGGACGGTGATTTCCGCATAGAAGCCAATTGGTCCTTTCGTGGCCGGTTGTAGTATGCGTTATCATAGCTGCTTATATTCAGTTACGGGTCCTATCCCCTCCTCGTATCCTCGCCTCCTCATTCGCTACGCCCGGTGGTCAGTAGAAGGGAGTTCGTTAAGACTCAGCCAAGTAAACTGGTCACGCGTAGACCAGGCTATATTGCGCCCATAATTCGTACCGTAGGCACTGGCCACGGGCAGCAGGCGCAGCGCAAAGCGCCTGTCTGGTCGAGGTTTGTTAGCCTTCTACACTCTCTGGCTAGAGATCAAGAGTCTTCAGTAAGCCTTGCAATGTCCTAGGGAGGCGACCGTTAACCAGGGTAAGCTTAAGCTTCTCCGCCCTCTTGTCTCGCTGCGTCCTCGATGAGTTGCTTGTAAAAACAAATGTAACCATTTCATATAGGCTTGCCCCGTCCGCGTTCGTCGGTCCCGAGGACAAAAGGGTCGTATGTCACGGACTACTGGGAGATGGTGCTGGTGTCGCCCGTTCCGAAACGATCGGTTCTACTGCTAGTGCTATGCGACGAGGCTGAGCGTAATATTTCTATTTCGGTACCCAATCGTTCATATGGATAAACTTCAAAAATTAGAAACAACAGATATAGCCAAAAGCTTCTGCTCCCCCTCCTCTCTAGGCTTTGACCATACTCACCGACCCGCTTTGCGGTCTACGCGGTGGCCATCTTTCGAAATCAAACTCTTATGAGGGTCGGCTCTGCATATACAAGCCTGACCTCTATTTCTTCCCAGACGGACGGCGGGTTAGACAGCCACGGAATACACCCTCTAGGTTACTTACCTGGTTAACAGGCCTGCTCCCCTAAAAGGCGCACCTGAAATTGACAACGAGCCTGCTGCAGTGTTCACGCCGCTTCGGATTCGAGACGCGTTACATCCGTTGAAAAAACCATACATACGGATATTCATGTTGAAAGTACTGAAGGCACATTCTCAGGTGCTTCGTCTGAACGGGACGTCCTCTTACGTGGGCTCCAGGCAAATCTAATCTAGTATTAGCACACGTTAATGGGCCCGACACAGCCTGCCCACTATATTGGAAACTTGAGAGAGCTTGGCATCGACCGATTCCTGATCGACATGTATGGCAAAGCGGGCCGGATGGGCGATCCAACGTATCGCCTTTAATTATCTCGACTTCATAGCAATAGCTCTAATTGTCACGCCGAATGTCTAGACCCATGTGGGTGGTGCTTCTCTAAGTCCTGTCCGCCCTACGGCAACTCCGGCGGTTTATGATGTTCTCGGTTACGTCGACCGTGAATTGATTAAGTGAGAGTCCACGGGCCGAGCTTGAGCTATGCGACGCCGCCGCCGACCGGAAGACGCGAAGAACGCAGTTCGTCGCGAGCAGGGGACCAACAGCACTCAGTAAGTCCCATGCTTCACGGGGATGATACCCGTGAGGATTCGTTAAGGCTACGAGGCCTGCGAATGTCGCAGGTGAACGGTTCTAGTTTATTTAGAAGTAGCGTCCGTTAGGACTTTGTGAGGGGACTAATTACGCTCGCCTCCTCCCTGTAAGAGAAGTAGTTCCGCGGCTCATCCAAATGTAAAGCGGCGACCCCTTGGACGATTCTGTGGTGGATACCCAGCAAGGTGGCGCTCTATGATGAGGCAGAATAGGATCAAGAGCCCCGTTAACTATCGAGGCGGAAAGGACAACTCTGCAGATCGTAATCTATGCAATTCATATAACTGGGGGTGCATAAGCTCACGGGTTGCAAAAGTTATGGCCAGTGCGTTTTCAGTAGGGATGGAACCTCCAATACCAGCGAGGCTTTGAATGATCTCCCGCCGTTACATTGCTTGCACAACAGCGTCTCACTGTGTTCAACTTGAATATTCCCAACTCTGACGGAACCTGGTGAAATCTGGAGGCAGAAGGACCAAAGCGGGTCTGCACGGGTGCCCAAGGACGGACGGCCGCTGTCGCCATGAGCGTGCACCCGGGTTCCGTTCGCTGAGCACTTTAGTTAATAAAATCGCACTTGACCACCATTGGCCCCTCACCCTGTCCTTAAGTGAGCTCGGCTCGCTAAGGGTGAATTAGCCGATACAAACATAACCGTCCTGCAGACACTGTTTGAAGTAGTGCTGTCTATCGGTAAGAGGACGGGTCGAAATAATTGCGACCGAAGTGGTTGAAAGTCCTCGAAGCCCAAATGACGAGGCGAGATCACGCATTACGGAATGGAAAAACCGTTGCACAGCGTAAATCTGCTGTCTATAGCTCAGAACCAGCAGCTGAATGGGACGGATGCGTCTGCTATCGGACTCTATTACGTTCTTTTTTATGGCGGACATATGGACGTTTGTGAACTGGGGACAGAGGCTTACTTAAACAGTTAGGCCTTGGTCTCGACCTTAGAGCCGTAACTAGACCGCCTCTTTTGTCTGGTCTCCCGGTGCGTGGATCTCGGTGTTTTCTAGACGGCGTATCCTGCTGTCGCTTGGCGTCTAAAACCGCCCACCTATCGGCGGAGCTGATCTGTGGGCCCAGTCGCATACCATTAGTCAGGCGAAAGTCACCCCTACTGAGCACTATAAATCCGCCGTCTTGCCTAGTAATAACGTACCACCGTGGTCCATATAAAGTACTTTTCTCGAAATTTTCCAGAAAGATATTACCCTACCGGTATTCCTCACAAACCACACCGACGTTAATCATTAAGTGAGGTTCAACTTAGATGAGATTCTTTAGAAGTCCATTGATCAAATAGGTTGAATCGATTCATTAAGGTTCACATCTGGTATGAGACCTACTGGCAGGAGTTGGGCTTCACTGGGGCGATTGAGGTCGGAGTGCGTCTCTGCCCGCAACGCACAGGCGGCGCCCACCTGAAGAGCACGCAGAGTTGCAGCAGAAGCGAAGTCAGCAAAAATGAACCCCTTGCTTCAGTAATGAGTAACTTTCCGATGTAGAGGCATTGCGGACACAAAATCATACTTCCGATAGGGCACGCATTATTTAGAATCGTAGTTCGTTATGTGATATTAGTCTGGAATAAGTCATCAGTTAGCAGCATTCGATCTATTCAGATTAACCTCGCAGGCGTAGGATACCTCTTGATCTCGCGAGTCATTTAGCACCCGGACTGCATTCAATTTTTCCGCACTACACGGGGCCCCGCTGCAGTATCCAGGTGAATGATCTGTTGTTCTGGAGTCGGCCTTGCTGCCGCGTGTCGGAAGCTGGACACACCAGAGACAAGCGAGACACATCCGTGGCCTGATGCTACTTGTTCCGTTCTTAACAGTCCCTTAGAACCCAGGGACTAATGGAGGTGGAGCAGATCCTAGCACGCTTAAACTAAAGTATATAGCGGACACTCGTGACGGACTCGACCTTGGGATCGTTTACAATTCATTAATCGATCAGCGAAAACGATTTACTTAAATCCCTATCGACGTAGGCAGGTTCTTAACGTGGTAACTGCCTCCCCACTGGTGTGTAACTGAAAGTGGGACAAGAATTACTGGCCCCTGATTTTTTACCCCTCTTTGCCCAAGCCATCGGGTCGTCGGTGTCAATAAACGTTTCTAGGTGATTTGAATGGGCGTGGTTACTCCAAGGATTCCAACGTGCCGTTCGTTTCCGAAAAGAATGAAGTCATTAGCTAAACGTGACTCCAGCTGTTGGGTTAGCATCGAGCGGGCACTACCCGATCGGCCGAATGTCGGTTAAAGCAACTACTCTTACAACTGTTAGAAGTCGACCGATCCCAATATTGCTGCAATTCAGGACTATCAAACTTCAGGTTAAGCTGAATCTGCAGCTTTCACGTGATAACCGACAATGAGGCTTTCTCTCCGCAGATCCTACTGGGTGTTGAGTCTACGCGTACGTGAGTTTACGGTTCGACATTCGTATAGAATCTTTAATACGGATAAATGGTTGGGTATAATGTGTCGAATGACCCGGGAAGCCTTGACCCGTCCCCCCTTTATTCTGCCGCGTCTAATGACACATCCCACTCATCTGGGTCTTTTATAATATCCATGATTCGCAGATCCGCTCGACTACTCTCTAAGGAGAGTGTCTGATGGTGAGAGCGCAAGACTAATTTAGGTTTAACCGGTGTAAGAACCCCACGATCTTTTGCACCTTTGCGTATGGCCATCCGGAAATTTATGACGATTTCGGAAGGCCACGTGATTAGATGAAAGCAACCCACCGCACGTATCCTTAACCCTTAGGACTCTAGTACTCATCATTTAGACAATTATGTATAGTGCAGGGGAAGTTCAGACTTCTAAAGTTTAGGAGTGGCGACATTTTCATAGTCAATTCTCGTCGACAGTTCAGGCACCGGATACGATAGCATGGATGCTCGCGATCCTGTCCTAAGATTTGATTCTACCTGTCTAGTAGACGTCCGTCGAGGGTGTTAATGTTATCCCACGCGCAACGGACAGTGCCACCCACATAGTTGACGAAACTTGGGATCACAGCGATTTTTTACTACGGTTCTATCTACTGCAGCCTTATCAGCATTGTATGCAGATGATCAGTGTCTAACTGCACTCAGCTGTTCGTGCGCTATGCACGCAGCCGTTAAATCAAACTTAACTCGACTCCGTCAAATTGAACGGGATGAGGCATAAGCAATCCCTGCCGAGGCCCATGCGCTCTATTAATGCCTGAACTCCCGCTTTCTACCGGCGAATGACAAGATGACTGGGTTGATTTTAAGTGGTCCGGACGTGACTGGTGGACAGAGACTGTGTCTCAATACTACACAGTAGACAGGACCGGACTTTACGGGCAGTCCATGATGGGATGGCGCCCGTATACGTGGCACGACCTCGGACTCGGTAAGTCTTTAGGGCTAGGACCTACTTAGCAACGCTAAGTGTGGAAGGGAAACGACCGGCCATCCGACCCGTTCCATTAGATATGGTCTCGTGTAGAGGCGTAGCATCTACGCTCGGTTCGGAATATCAGGTGCGCCGTGCATGACTAAACAATACCTCGCATTGGCAGGACGTTAAGGATTCGACACCGCACCTGGCAGGCGTATTCGTTGGAATCTGGTCGTGAGATTTTGCGTAAATGCTCTCCACATCTTGCCGTGTTACTTAACACTCTCATGTGGTCGATAACAATAGTGCGTATTCTTAAAGATGACGTCAAGGTACCTCTAGTTGGCTTTACAGTTCTGACGAACAGGTAGCCATGGATGAGTTCTATACTAGCGGCCTGTGAACAGTTGCGCTGCCTGCTCGAGTATTCCTGGAAGAAAGTCCCTTATTCTCCGTGCTCCGTCAGATACTAGAGCTCTTCGTAGAGGATTGGGACCTGCGACAAGCTCTAAGAGCGACCCTGTTGGTATTACTTAGAAAGCCATAGGATTTCAGTCGCTCACTCAGGCTAAACGGACGGTGGGGTTCGTCTATTAACAAGCCCCCCTCTCCTGTTTGTACGCGCGTCAACGGAGCGGCGACGTCGCTAACGTACGTGCTGTCCTCACTAGCGCCGCCGGAGTAAGTGGCGGGCGGTAGACAGAACGACCGAGGAGTTCAACGGACACACATGCCCGCCGAGAGCCTCGGAAATCCTGTAGATGCGAGTCAACTCTTTTGTACCGCATTAAGGGGTATCACGGCGATAATGCCTCCGAGATCGGGCCTGGTTGTTAAGCCATTGCCACGACAGTCGTGGTGAAATCTAAGCATCCCCGGGTCACTGTTCAACATCATTCGACGTGCGTACCACCATCGATCAAGAGGTACTGCTCAGGCCTGCTCAGGTGGGCGGTTGGGCCGATAGCCAAGCTCGCCACCCTAGCCCCCCAGGTCAGCGCGGCCTCGATAATAGAATGGGCGGGCGCGGTCCGGTTTATTATGATCGAATGTGGGACTAAGGGATTCCTTCGGCCCACGGTGGGCTGGTGGGTCGCAATAATAACGCGGACGAACCTATCATCGTTAAATATCGCACCAGGCTCGGAATAGGATAGCACAACTTGTGAAGGAACAACCCGGTATTTATCCTCTTCCGCATGCCTGTTCCCCAATCACATTGTCATAGCCAGGTTCTGAAAGTTTGCCCTGAACCCACCCAAACAGGGTAGCTTCTGGCCTGTAAACCACATGGTGATAGCCTCCGAAGCTTGGTTGGCCTTATCCCCCTTCTATAAATACACGTTGCCAGTCCATAATTGGAGGTAAAATACCAAACGTTGTATATATGGCATGAGAGTCACCCCCACCTGTGAGCACGCCCTCAACGGTGAGCACATGATGTGTTGCCGATCGGAATATTGGAGGCCTGTGTACTCTGATTCATCGACGAGCTGACATAGAAGTCTCCAGTCCATCTCCCCCGTTACGTATGCTTCGGAGCTATCTTTCCATAGTGGCGCTTCAATTTAGCCACCCGTTGACAGCAGGGAAGAGACGTTACCAATTGTCCATAGGACAACAAATATGGGCTTTATAGTGTAACCAAACAGTGTCGCCGGGTAGGAGGCCGTGCCGTAGGAAAAAATTTTCCTTATCTAGCCAGTGCTGCCTTAAAGTTAGACTGCGGATGCGTAAGACGGGACAAGTTATGAGAACGGAGCCCTTAAGCAAAGTGATCCTACCATTCGCGCGATACTTGTACATCGAGGCCCTTGGAGGATAGCGCCTCCCCTGTCCATTCTATGAATGACCGAAGGGTGATCTAAACCTGTTATATTTTATGGATCCGCATTAAGGATGGTTTCCGTCCGTCATTCGGATGTCGGGCGGGTTGTGCGGTCACTAGAATTTCATCGCTAGATAATTATATAAACAAGCTCACTTTGTCGTGCACCGCGGAAATCACGACCACCAGATCTTCATATAATAAAGGACGGGCATTAAAAGCTCAGAACCCCCGCAAAGCGCAGAGGCTCCGACCTTGGAAGGGACCTACCATCGCGCCTAGTACGGATCCCAGACAAGTGGGAATCTGTACAATCTAGTGTGATAAACTCGTACCTTCGTCTATATGAAGATTGAGTTTAGTAGAGCGCTATCTTACAACCCAGTGCTACAGTGGCAAATGTTGTGAGGCCTTATGCAGCTTGCCTAAGTTCGCGAATGTTGATATGTCTACCTGGCTCGCGTGACAGCAACTTACTTGTCCGTACTGATAGGTCAGTGTAGGGGTACAGGTGAGCGCGGGCCCCTGTATTTGTAAGAGACTTAATATGTGGACCGGTGATCCTGTCCGCTTAGTAACAGGTGTCCTACTACCAACACACGCATTTACCCCGAAGCGACCGCTTCCCGGTAAGCGACTTGAAGGGCCGCACTGTTACTCCGTCGTACTTAGTAGTCATTTAATAATACTGCAGAAGATAATCGACGGCACAGGACTTACCTGTCGAGCTTGTGTCAGTAGGGTTTTGCTGCATGGCTGTGAGGAAACGTTGGCACATTCCTTTGGCTATATCGGATAGCTCACTTTTGAAGTCTGGTTAACAATGCTGGTAATCGATGTATAGACTTCTGTCACCCAAAACGGTCCTTAACGTGTGCAGTCGCCGGGTGCAACACGGGCTCGTCTCCTGTTCAAGGATTTACCGATTACACTAACCCGATTCACGCGTGCGTAACAATCTTCGACAGCCGTCAGCGTCCAGGAACCGATAGAGGGAGGGTGGTTCAGTGATGGTTAACCGTGAGCCGGGTAGGAGTAAGCCCGTGTTTAATTAAATTTTCGTAATTTGGCGCATGAGGGTTATTTACCCGCGCGTCTGGGCCTGCACATCGACACAAGCGAGGTTGTGGGACGGAAAAGAATCAAAATGCCTGTTACGGGCAAGCACCAATTAGACGGGGTCTTCGGAGTGATCCGGAGAGCGAATCTAGGAGATACGTCAACTTGTTCTGGCTGTTGGGCACTTATGGACGTAACAGCCTAACGAAGCTTACTCGTCAGTGTCATTGAAAGGCCTTGACGGCACACCACATCTATGTGGGCTCGCCTAACAAGCACCTGACTTAACATATGCCCAGAAGTGCGGTACACGATCCTCAGGCCAAATTTGTCGGCGGCTGCCCTGCCTACTTCCCTATGGCCTACCATGGATCTTGGAATCCACGACGGTTCCTTAATTCATAAAATGTCTGAGAACGCTCCTAGCTGAGCGGTCCATTGTTATCATTGCCTTTTCCTACGCACTTCTGCACTTTCGGACTTCTAGTTTAATATATTCTATATCAAAGCCGAGTAATGCGCTCCGTTAGGAGGTCCGAAAGTCTGTTAGTGCTGGACCTTCAAGGTTGTTACATTGATTGTACGGACAAGGGGAACGTCCAATAAGACATGTGACGTATGGGCCCTCGCACTCTGATGGCGCTGGCGGTAAGCTCCTCTCCGTCCTTGTATATCCCGTTCTTTGGGCTACAGGCCTGGGTTTGATACCAGGAGCTAGTAAAAGCTTGACTGCGTGTTCGGGTCAACTATAGCCGCTGGCATAACAGCAATACGTGGTTTGTTAGGCTTCAAGTCACGATGGGATTGGTGGCCCAATCTGAGTTGGAGGCTGTCCGACGCATATCTTTTAGGTCAGATGGAAAGAATCCCACGCGAAAGACCCTTACTACACCCTTTCTACTCTTAGTATTTCTATACGCCGTCCTAACTACCATGAGCAGTTTTCTCGTCCAGCCGCTTTTCCCTCGTCCGCAGCAGCCTACAGGACTTCTTATAGTGAACCAAGTGCATTTTCTCCAAATTCCTTCCTGATTCAACGCGAGCTTTGGAAAAGATCCGGTGAGGATTCCTCGGAGTGCCGTATCTTGTGGAACAAGGGCGATCATGATTGCACGCCAATCCAAGAGGCTTCACGCAAAGCTTGAAGTCTATCTCTCCATGTTAGAGACTTACGGTATGTAGTCACTTCAGGTCTAGATTCACTGTCCGCTCCTATAGTCCTCAATGTGCAACTGAAGTAGGCGGGACTACTCGGGCCGCAGTAAAGGACGTCCGGCCAACTTCTGATACCATATGTCGTTATGGATATCGCACCATACCCTATCGGCGGGCTTCTGCTTTACTCTCGACAGCCGGGCGCGCAGAGACTCTGCTATAAGTAACTTCACGAATGGGCGAGGTCGCGCTAAATAAGTTAAGTTAGATAAAAGAAGGGGCAAAAGCTTGAGAAGATGTCAAAAACGTAGCCGAGAATTGGTACCTAGAAGACCCACTCCCCGACACTCAGGTGACGGGCGTCTGGCACTTAGAACAGTCAACGTGTTCGGTTTGAACCCGAACGGTGCATTTAACGCAAGTTATATAGGACGAAGAGTCTTCACGTGAGATACACTGCATTGTTCCGTGTGAAACTGCTTGATCTGTATAGCTCGATCGGCAAACTGATAATCAGTCAAGGTTTAAACGTATCATTCCATGATTTGGTGAAGGAGGGTGGGGTACATTCAAACATCTGATGGACTGAATTGATCCGTGTAACCTAGTCTGCTTGAGAAATAATAAAGCCCGAATCCGCCAAGGTTTGCCAAAACAAACCGCGTACTGCTTTGTCATGGCACAGCTCCGGATGGAGTGCCAAGCCTGACCGCTACCCCTCGATAGGCCCTTGTAGTGGGATACCTACGAAAACATCAAGGTTGCACGGAAGTACGAACGGCTTGATTCTTCGTGAAAGTAGGGAACTGGTTTTAATAGGGTTATTGACATAGCAAGATACTTATCTGGAGAGTTATTGCAAGACTTCTTTACAGCGAGACGTATCAACTTACACGCGGGCTTGGAGAAGGGCAATAGGTAGACACAAAGATTCAACGGCCGACTTGTAACAATTCACCCGCAGCGTGATCGTTTCACGAACACGTATTTCGAAGGGCTGTTTCTCCGGGCGCGAACCCGAAGGCCCAGGGGACATGGTAAGGCCAAAGGTACCGGTGTCGGTTTCCCGGCGCTGGCTACAGGAAAGAGCGTGGGGCCTGAATTAGCCGCGCCTGCGGAGTCGGCAAATTTCCCACATCGCCAACACGACCCATCCTCCAAGCTCCTACATAACCACGTGTCACCATGACATGCATGTGCACATTACTATTGCGAGACGTGTCACGTGAGCCAAGCTTCGAACAAGGTCACATTTAGGAGCCCTCCCATCTAAGCATGACCGGGGAGCACGTTAGTGTTAAATACCATTGGTTGGCCTTAGGGCGCCTGTGCAACACAGCTTTAGTTGCCCTGATTGCTCGCCACGGGGTCCCCTTATAGCCGTGCATGGTGTCTTCGTTATTCCACTAAAACTGGCAACACATGCCTGAAGACAGCCCAGGGAGTGCGTCAGGCAGGGGGAATCGCAACCCCGAGTCGCCGAGTGTGGTCGGACATCTGTCGGGACCCTCAACTAAGTCGCTTCGGAAATGCCTGTATTTCTAACATTCTTCTTCTTGCGGTCGGAACGTACAGACCGGATGCTACTATCTGATCAGTGGAATAGCCAAGTCTGAGGTCCACACCTTCAGTTTCTGGTAGGGGGAATGTCCAGCAAGGTGCCCAACCCCGACAAGAGAGTTCTCAATGGTCGAGCTACGCGCCAACAGGGTGCTATATGAAATTGTCATGTAGTGTGATTATCCGACCGAGAGATTTGCCAGCTCTGCCAGAGCAGTATCACGATCCACACCGACAGTGCACGACAATTGGATATGCAATTCGAGGCATGTGCTTACTCCAGCCAAATCTTCCATGCAGCGATTAAGCGGGTTCAGTAGTGCCGGTATAGATTATCTACTCGCATGACTACTCCGTACTTTGCAACTTTGATAACGCAACAGTGTACCGGTTTGAGTTCCTGGAGTCCCATGGACAAAGGTATGGAGGATACTTGTTTATGGCATTAATTGTAGGAATGGGTGATACCTTTACACAACTGGTATTGCGTAGTCGCATTGGGCGTGCAACCGAAACCCTGAATCGAGGAAGTCCCCCCGTTATCGTTGGAGGCGCAGTTTTATGAAATTCTTATCGGAGCGGTTTCTGGCTATACGTTCCGAGGCAAAGGTTCAACTCGCCGAAAGTCAAAACATACGCTGATGGTGGGATCTGCTTGTGAGTCATCACTTCGTCCTTGTATATCACCCCAGAGCTGCTGTTGAGGTTGGACCCCGTAACCATCCCTTGAGATGAGGTTAATTGATAGGTTTGTCAATACAGACCCGGCATACGTTAAGATAGTTTTTCATTCGGCTATACTCCGGAGAATCTTACATACGGAGCCTTCGTCACCCCGTCCCCTTCTGCAGCCGAACAGATTGGACGGGTATGTCCGCCCGATTTCCGCCGAAGCGGACGATTGTAAATATGGAAGCAGCCCGCCGATTCAGGATTATATAGGAGGGTTGCCCCCCTGTAACGCCTTGTCGGTAGATTATGAGTTTTTGCGTTCGGTCACACCAAGTACGTTGGAGAACACGATAATTACCGTCGGGCTGAACCCTGTGTAGAATATTGCCTTGCCGCGCCCTGCCAGGTAAAACTGAACGGACCCTCTGGCCTTAATGGGAGCAGACTAGCAAAGTCAATATGTACTCCTAGGATGTGGGGTCTACCACACTCTAAAACGCGCAATGCGTCCACATTACGTGGGAGAAGCGTGCCCAGTTCTCTAACCGCGCCGTAGGCCAGGCATCGCTAAAAGTTGAACTCTCCATTACTAGAGACCTTAGCATACTTGGCTCTCAGCAGCTGAGCATTGCACGGGCGGCCAAGATCAATTTCCCCCTTGGATTCAATATGAACCTAAAATTGGGATCGGCCATTAAACCGCTTGCGCGTAGCGGGTTAGGGAGCAACTCGCACGAAGACAAAAATCAAACCCGTTAGCTGTTTCTCGCATTTTCTACCTACGCCTGCGGCCAGCTTCTCACGGTGCCTCGGGGTTACAGTTGCTAGGCCTCCCGACGTAGTTCAGACGTACCCCATCCTGTAACGCTTATTATTCCAACAAGGACAAGATTTTGATCCTCTTGGTCCCGGACAGGTTAAAAATCCTCAGGCAGAATCCAACTGAAGAACCCGTTAAAGATTGCTATCCTATGTCCGGCGCGTCTGGAGGATTTGTTCACGTAGTACCAGATGTATAGCCCGTTTTTGCTATATCCTCAGATTTCGGCACACGCAGGAGCTATACGCATTCACTCGACCCTGTACTACTTTACCATCATAGTCCACGTGTAGTACCCGACTGGCTCAGTGCGGCCAATCTAGACGTTGGAGACGGGCCTTTCTTGTACCCCGCAGAGGATAAGCAAAAGACTGGTGAAGGATGGGAATAAGAGCGTAAGAGAACGCCTGGATGACCGGTCCTCGCT"
minimum_skew(s)
In [ ]: